世界の技術ニュースをリアルタイムでキャッチし、日本語でわかりやすく発信。AI・半導体・スタートアップから規制動向まで、グローバルテックシーンの「今」をお届けします。

Claude Opus 4.7登場：Anthropicの“本気のコード職人”がまた一段進化した

Anthropicが新しいモデル Claude Opus 4.7 を一般公開しました。ひとことで言うと、これは「難しいソフトウェア開発を、より長く、より正確に、より自律的にこなせるモデル」です。
AIモデルの発表って毎回「すごいです」と言われがちですが、今回はかなり具体的です。特に advanced software engineering、つまり“人間でも骨が折れる複雑な開発作業”での改善が強調されています。

キーポイント

Claude Opus 4.7 が一般公開
Opus 4.6 より、難しいコーディング作業で明確に強化
長時間かかる複雑なタスクでも、粘り強くミスなく進めやすい
画像理解が向上し、高解像度の画像を見られる
UI、スライド、ドキュメント作成の“センス”も改善
価格は Opus 4.6 と同じ
セキュリティ用途には制限付きの安全対策を導入
Claude API、Bedrock、Vertex AI、Microsoft Foundry などで利用可能

まず何がすごいのか

Anthropicによると、Claude Opus 4.7 は Opus 4.6 の明確なアップグレード です。
特に効いているのが、次のような場面です。

複雑で長いコード作業
途中で詰まりやすい多段階のタスク
指示が細かい場面
自分の出力を検証してから返す必要がある場面

ここが面白いところで、Opus 4.7 は単に「答えを出す」のではなく、自分の出力を確認するような振る舞いが強いとされています。
これは地味に見えて、実運用ではかなり大きいです。AIは“それっぽいけど間違い”を出すことがあるので、自分でチェックする癖があるモデルは、現場ではかなりありがたいと思います。

Anthropicの説明では、ユーザーは「以前なら近くで監督しないと任せづらかった、いちばん難しいコーディング作業」を、Opus 4.7 に安心して任せられるようになってきたとのこと。
この表現、かなり重要です。AIが“補助輪”から“実務担当”に近づいている感触があります。

何が変わったのか：ざっくり言うと3つ

1. コーディング能力がさらに強くなった

Opus 4.7 は、ソフトウェアエンジニアリングの難問で改善しています。
Anthropicは、93件の coding benchmark において Opus 4.6 比で解決率が13%向上 したと述べています。しかも、Opus 4.6 でも Sonnet 4.6 でも解けなかった4つのタスクを解いたとのことです。

こういう数字は、AI好きとしてはかなりワクワクします。
「13%」だけ聞くと小さく見えるかもしれませんが、難問の世界ではこの差が大きいことがあります。しかも、単純な一問一答ではなく、長時間・多段階・バグ修正・検証みたいな、現場で本当に面倒な作業に効いているのがポイントです。

2. 画像を見る力が上がった

Opus 4.7 は vision、つまり画像理解も改善しています。
しかも「より高解像度の画像を見られる」とあります。これは、図表、技術資料、スクリーンショット、化学構造式、複雑なダイアグラムなどで効いてきそうです。

地味だけどかなり重要です。
AIがコードを書くだけでなく、画像から情報を読み取り、作業に反映する場面はどんどん増えています。たとえば、障害画面のスクリーンショット、設計図、スライド案、あるいは研究・法務系の文書などです。画像認識の精度が上がると、AIの守備範囲が一気に広がります。

3. “見た目のセンス”もよくなった

Anthropicは、Opus 4.7 が professional tasks を仕上げるときに、より tasteful で creative になったとしています。
UI、slides、docs の品質が上がった、という話ですね。

これ、個人的にはかなりおもしろいです。
AIは“正しい”だけでなく、“見栄えがいい”“そのまま出せる”が重要になってきています。開発者や企画職の人は、正確な文章よりも「そのまま社内に見せられるか」「顧客に出せるか」が大事だったりします。そこに効くのは、かなり実務的な進化です。

セキュリティ面ではかなり慎重

今回の発表で注目すべきなのが、Cybersecurity に関する扱いです。

Anthropicは先週、Project Glasswing を発表し、AIモデルのサイバーセキュリティにおけるリスクと利点を取り上げました。その流れの中で、今回は より能力の低いモデルで先に新しいサイバー安全対策を試す方針を示しています。
Opus 4.7 はその最初のモデルで、Claude Mythos Preview ほどサイバー能力は高くないとされています。

さらに、禁止されている、または高リスクのサイバー用途につながるリクエストを自動検知してブロックする safeguards を搭載してリリースしています。

ここはかなり現実的だと思います。
AIが強くなるほど、便利さと危険性はセットで増えます。Anthropicは、いきなり最強クラスを全面展開するのではなく、安全策を先に運用し、現実の利用から学ぶという進め方を取っています。少なくとも姿勢としては筋が通っています。

一方で、正当なセキュリティ用途、たとえば vulnerability research、penetration testing、red-teaming などを行う専門家向けには、Cyber Verification Program への参加案内もあります。
つまり、「危ない用途は抑える。でも、正当なセキュリティ研究は支援する」という整理です。

価格は据え置き

うれしいのは、価格が Opus 4.6 と同じだという点です。

入力 tokens: 100万あたり $5
出力 tokens: 100万あたり $25

この価格据え置きは、地味にすごいです。
AIモデルは性能が上がると値上げされることも多いので、性能向上＋価格維持 はかなり印象がいいです。開発者目線では、導入判断がしやすくなります。

実際の評価ではどうだったのか

Anthropicは、早期テスターや提携企業から多くのコメントを載せています。
こういう“企業のコメント集”は宣伝っぽく見えることもありますが、今回は内容がかなり具体的です。

たとえば、以下のような評価がありました。

複雑な async workflows（非同期で進む作業）に強い
CI/CD や長時間タスクで安定している
データが足りないときに、無理にそれっぽく埋めない
tool calls（外部ツールを呼び出す操作）の精度が上がっている
loop resistance が高く、無限ループしにくい
エラーが出ても粘って復帰する
長文コンテキスト でも安定している

このあたりは、AIを実務で使っている人ほどピンとくるはずです。
正直、ベンチマークの点数だけ高くても、現場で「途中で止まる」「同じことを繰り返す」「変な fallback を出す」だと使い物になりません。
その意味で Opus 4.7 は、**“賢い”だけでなく“現場で使える”方向に進んでいる**のが良いです。