Anthropicが、Claudeの最上位クラスにあたる新モデル Claude Opus 4.8 を公開しました。
ひとことで言うと、「前の版より、コード・自律作業・仕事での使い勝手がしっかり良くなった」 というアップデートです。
しかも面白いのは、ただモデルを新しくしただけではなく、使い方そのものもいくつか進化している点です。
個人的には、こういう「モデル本体の改良」と「周辺機能の改善」が同時に来ると、実際の体験がかなり変わるので、かなり重要な発表だと思います。
Claude Opus 4.8は、Opus 4.7の上位版です。Anthropicによると、ベンチマーク(性能テスト)全般で改善していて、特に次の領域が強化されています。

ここで大事なのは、単純に「賢くなった」だけではなく、協力相手としての質が上がったと強調している点です。
AIは、点数が高いだけでは実務では使いにくいことがあります。途中で話が飛んだり、勝手に自信満々で間違えたりすると、むしろ手間が増えるからです。Opus 4.8は、そのあたりの“お世話のしやすさ”が改善されているようです。
Anthropicは、早期テスターのコメントをかなり多く載せています。
これがなかなか面白いです。なぜなら、ベンチマークの数字より、「実際に触った人がどう感じたか」 のほうが、現場では効くことが多いからです。
たとえば、テスターの声では:

といった評価が並んでいます。
特に印象的だったのは、
「自分で問題点を先に指摘する」 という評価です。
これは地味ですが、実務ではかなり大きいです。AIが間違った方向に進んでいるのに、ユーザーが最後まで気づかないのが一番怖いので、こういう性質はかなり価値があると思います。
Anthropicは今回、Opus 4.8の改善点として honesty(正直さ) を大きく打ち出しています。
ここでいう正直さは、「嘘をつかない」という単純な話だけではありません。
AIはときどき、証拠が薄いのに それっぽく結論を言ってしまう ことがあります。人間から見ると「堂々としていて頼もしい」ように見えて、実は中身が薄いことがある。これが厄介なんですよね。
Anthropicによると、Opus 4.8は:
とのことです。
この「4倍少ない」はかなり強い数字ですが、もちろんこれはAnthropicの評価に基づくものです。
とはいえ、AIに必要なのは“強気”より“誠実さ”だという方向性は、私はすごくまともだと思います。実務で本当に怖いのは、賢いふりをした雑さなので。
Anthropicはリリース前に、いつものように alignment assessment を行ったとしています。
alignment はざっくり言うと、AIの振る舞いが人間の意図や安全性に沿っているかを見る評価です。
今回の評価では、Opus 4.8は:
といった prosocial traits(協力的・社会的に望ましい性質)で高い結果を示したとのことです。
さらに、
deception(だますこと) や misuseへの協力 といった望ましくない挙動は、Opus 4.7よりかなり低く、Anthropicの別のモデル Claude Mythos Preview に近い水準だったと説明されています。
このへんは、派手さはないけれど重要です。
AIが強くなるほど、「何ができるか」だけでなく「何をやらせてよいか」が難しくなるので、安全面の強化は避けて通れません。
今回の発表は、Opus 4.8だけではありません。周辺機能の更新もあります。これが実はけっこう本命かもしれません。
Claude Code に dynamic workflows が追加されました。
これは、Claudeが大きな作業を自分で計画し、数百のparallel subagents(並列で動く小さな作業担当)を回しながら進められる機能です。
要するに、
「でっかい仕事を、分解して、同時並行でさばく」 仕組みです。
Anthropicは例として、数十万行規模のコードベース移行を、開始からマージまで進められると説明しています。
ここまで来ると、もはやちょっとしたアシスタントではなく、かなり本気の開発補助システムです。
個人的には、この方向性はかなりおもしろいです。AIの価値は「1回の回答のうまさ」だけでなく、大きな作業を最後まで運べるかにどんどん移っていると思います。
claude.ai と Cowork では、effort control が追加されました。
これは、Claudeが1つのタスクにどれくらい頑張るかを、ユーザーが選べる機能です。
つまり、
「急ぎの雑務は軽く」「難しい仕事は重く」 という使い分けがしやすくなりました。
こういう機能、地味ですがかなり便利そうです。
AIは毎回フルパワーで考えればいいわけではないので、用途に応じて力加減を変えられるのは、実際のユーザー体験を良くするはずです。
開発者向けには、Messages API が更新されました。
これまではやりづらかった、会話の途中でClaudeの指示を差し替えることがしやすくなっています。
Anthropicによると、これによって:
とのことです。
これはエージェント開発をしている人にはかなりありがたいはずです。
現実のシステムでは、途中で条件が変わるのは普通なので、そこに柔軟に対応できるのは実務向きです。
Opus 4.8はデフォルトで high effort になっています。
Anthropicはこれを、品質と使いやすさのバランスがいちばん良いと判断しているようです。
また、より重い設定として:
も選べます。
難しいタスクや長時間の非同期ワークフローには extra を勧めていて、さらにClaude Codeでは高effort向けにrate limitsも増やしたとのことです。
要するに、
「ちゃんと考えさせるなら、そのぶんコストもかかるよ」 という現実的な設計です。
ここはとても正直で、私は好感を持ちました。
うれしいポイントは、通常利用の価格はOpus 4.7と同じだということです。
fast mode は:
となっています。
しかも fast mode は、前のモデルより3倍安いとされています。
速度を優先したい場面ではかなり使いやすくなりそうです。
今回のアップデートは、特に次のような人に刺さりそうです。
特に、「長く回し続ける仕事」 に強くなったのは大きいです。
AIは短いQ&Aだけでなく、途中で詰まらずにタスクを完走できるかが本番なので、ここが改善されると実用性はかなり上がります。
Anthropic自身も、Opus 4.8は modest but tangible improvement、つまり
「控えめだけど、ちゃんと体感できる改善」 だと説明しています。
そして同時に、今後の方向としては:
を進めるとしています。
つまり、Opus 4.8はゴールではなく、次の段階への橋渡しという位置づけです。
このあたり、AI業界らしく「まだまだ先がある」感じで、ちょっとワクワクします。
Claude Opus 4.8は、派手な“革命”というより、実務で効く改善を積み重ねたアップデートです。
でも、AIはこういう地味な改善のほうが、結局いちばん効くことが多いんですよね。
特に今回は、

がそろっていて、「AIを便利なおもちゃから、仕事相手へ寄せていく」 方向がはっきり見えます。
個人的には、Opus 4.8の価値は「賢さ」そのものより、安心して任せられる感じが増したことにあると思います。
AIは結局、最後まで信頼できるかどうかが勝負ですからね。