PaPoo
cover
technews
Author
technews
世界の技術ニュースをリアルタイムでキャッチし、日本語でわかりやすく発信。AI・半導体・スタートアップから規制動向まで、グローバルテックシーンの「今」をお届けします。

Claude Opus 4.8登場。Anthropicが「より賢く、より正直で、長い仕事に強い」新モデルを発表

Anthropicが、Claudeの最上位クラスにあたる新モデル Claude Opus 4.8 を公開しました。
ひとことで言うと、​​「前の版より、コード・自律作業・仕事での使い勝手がしっかり良くなった」​ というアップデートです。

しかも面白いのは、ただモデルを新しくしただけではなく、​使い方そのものもいくつか進化している点です。
個人的には、こういう「モデル本体の改良」と「周辺機能の改善」が同時に来ると、実際の体験がかなり変わるので、かなり重要な発表だと思います。

まず要点だけ

何が新しいのか

Claude Opus 4.8は、Opus 4.7の上位版です。Anthropicによると、​ベンチマーク(性能テスト)全般で改善していて、特に次の領域が強化されています。

image_0002.webp

ここで大事なのは、単純に「賢くなった」だけではなく、​協力相手としての質が上がったと強調している点です。
AIは、点数が高いだけでは実務では使いにくいことがあります。途中で話が飛んだり、勝手に自信満々で間違えたりすると、むしろ手間が増えるからです。Opus 4.8は、そのあたりの“お世話のしやすさ”が改善されているようです。

現場の声がけっこう興味深い

Anthropicは、早期テスターのコメントをかなり多く載せています。
これがなかなか面白いです。なぜなら、ベンチマークの数字より、​​「実際に触った人がどう感じたか」​ のほうが、現場では効くことが多いからです。

たとえば、テスターの声では:

image_0003.webp

といった評価が並んでいます。

特に印象的だったのは、
​「自分で問題点を先に指摘する」​ という評価です。
これは地味ですが、実務ではかなり大きいです。AIが間違った方向に進んでいるのに、ユーザーが最後まで気づかないのが一番怖いので、こういう性質はかなり価値があると思います。

「正直さ」をかなり重視している

Anthropicは今回、Opus 4.8の改善点として honesty(正直さ)​ を大きく打ち出しています。

ここでいう正直さは、「嘘をつかない」という単純な話だけではありません。
AIはときどき、証拠が薄いのに それっぽく結論を言ってしまう ことがあります。人間から見ると「堂々としていて頼もしい」ように見えて、実は中身が薄いことがある。これが厄介なんですよね。

image_0004.svg

Anthropicによると、Opus 4.8は:

とのことです。

この「4倍少ない」はかなり強い数字ですが、もちろんこれはAnthropicの評価に基づくものです。
とはいえ、​AIに必要なのは“強気”より“誠実さ”だという方向性は、私はすごくまともだと思います。実務で本当に怖いのは、賢いふりをした雑さなので。

安全性・整合性の評価も実施

Anthropicはリリース前に、いつものように alignment assessment を行ったとしています。
alignment はざっくり言うと、​AIの振る舞いが人間の意図や安全性に沿っているかを見る評価です。

image_0005.svg

今回の評価では、Opus 4.8は:

といった prosocial traits​(協力的・社会的に望ましい性質)で高い結果を示したとのことです。

さらに、
deception(だますこと)​misuseへの協力 といった望ましくない挙動は、Opus 4.7よりかなり低く、Anthropicの別のモデル Claude Mythos Preview に近い水準だったと説明されています。

image_0006.svg

このへんは、派手さはないけれど重要です。
AIが強くなるほど、「何ができるか」だけでなく「何をやらせてよいか」が難しくなるので、安全面の強化は避けて通れません。

同時に出た新機能がかなり実用的

今回の発表は、Opus 4.8だけではありません。周辺機能の更新もあります。これが実はけっこう本命かもしれません。

1. dynamic workflows in Claude Code

Claude Code に dynamic workflows が追加されました。
これは、Claudeが大きな作業を自分で計画し、​数百のparallel subagents​(並列で動く小さな作業担当)を回しながら進められる機能です。

要するに、
​「でっかい仕事を、分解して、同時並行でさばく」​ 仕組みです。

image_0007.svg

Anthropicは例として、​数十万行規模のコードベース移行を、開始からマージまで進められると説明しています。
ここまで来ると、もはやちょっとしたアシスタントではなく、かなり本気の開発補助システムです。

個人的には、この方向性はかなりおもしろいです。AIの価値は「1回の回答のうまさ」だけでなく、​大きな作業を最後まで運べるかにどんどん移っていると思います。

2. claude.ai で effort control

claude.ai と Cowork では、​effort control が追加されました。
これは、Claudeが1つのタスクにどれくらい頑張るかを、ユーザーが選べる機能です。

image_0008.svg

つまり、
​「急ぎの雑務は軽く」「難しい仕事は重く」​ という使い分けがしやすくなりました。

こういう機能、地味ですがかなり便利そうです。
AIは毎回フルパワーで考えればいいわけではないので、用途に応じて力加減を変えられるのは、実際のユーザー体験を良くするはずです。

3. Messages API の拡張

開発者向けには、​Messages API が更新されました。
これまではやりづらかった、​会話の途中でClaudeの指示を差し替えることがしやすくなっています。

Anthropicによると、これによって:

image_0009.svg

とのことです。

これはエージェント開発をしている人にはかなりありがたいはずです。
現実のシステムでは、途中で条件が変わるのは普通なので、そこに柔軟に対応できるのは実務向きです。

effort の考え方も整理されている

Opus 4.8はデフォルトで high effort になっています。
Anthropicはこれを、品質と使いやすさのバランスがいちばん良いと判断しているようです。

また、より重い設定として:

image_0010.svg

も選べます。

難しいタスクや長時間の非同期ワークフローには extra を勧めていて、さらにClaude Codeでは高effort向けにrate limitsも増やしたとのことです。

要するに、
​「ちゃんと考えさせるなら、そのぶんコストもかかるよ」​ という現実的な設計です。
ここはとても正直で、私は好感を持ちました。

image_0011.svg

価格は据え置き

うれしいポイントは、​通常利用の価格はOpus 4.7と同じだということです。

fast mode は:

image_0012.svg

となっています。

しかも fast mode は、前のモデルより3倍安いとされています。
速度を優先したい場面ではかなり使いやすくなりそうです。

どういう人に効きそうか

今回のアップデートは、特に次のような人に刺さりそうです。

特に、​​「長く回し続ける仕事」​ に強くなったのは大きいです。
AIは短いQ&Aだけでなく、途中で詰まらずにタスクを完走できるかが本番なので、ここが改善されると実用性はかなり上がります。

image_0013.svg

ただし、まだ“完成形”ではない

Anthropic自身も、Opus 4.8は modest but tangible improvement、つまり
​「控えめだけど、ちゃんと体感できる改善」​ だと説明しています。

そして同時に、今後の方向としては:

を進めるとしています。

image_0014.svg

つまり、Opus 4.8はゴールではなく、​次の段階への橋渡しという位置づけです。
このあたり、AI業界らしく「まだまだ先がある」感じで、ちょっとワクワクします。

まとめ

Claude Opus 4.8は、派手な“革命”というより、​実務で効く改善を積み重ねたアップデートです。
でも、AIはこういう地味な改善のほうが、結局いちばん効くことが多いんですよね。

特に今回は、

image_0015.webp

がそろっていて、​​「AIを便利なおもちゃから、仕事相手へ寄せていく」​ 方向がはっきり見えます。

個人的には、Opus 4.8の価値は「賢さ」そのものより、​安心して任せられる感じが増したことにあると思います。
AIは結局、最後まで信頼できるかどうかが勝負ですからね。


参考: Introducing Claude Opus 4.8

同じ著者の記事