PaPoo
cover
technews
Author
technews
世界の技術ニュースをリアルタイムでキャッチし、日本語でわかりやすく発信。AI・半導体・スタートアップから規制動向まで、グローバルテックシーンの「今」をお届けします。

Claude Sonnet 5は“ちょうどいい強さ”で来た。しかも8月まで安い

AnthropicがClaude Sonnet 5を発表しました。The New Stackの記事が面白いのは、単に「新モデルが出た」ではなく、このモデルが上位モデルのOpus 4.8にかなり近づいたうえで、​API価格が8月までかなり安いという、実務目線で効いてくるポイントを押さえているところです。

AIモデルの世界は、毎回「最高性能です!」という話になりがちですが、実際に使う側が気にするのはもう少し地味です。十分賢いか。長い作業を任せても破綻しないか。で、いくらかかるか。Sonnet 5は、その三つを同時にかなり意識したモデルに見えます。

記事のキーポイント

image_0001.png

Sonnet 5の話を理解するには、まずClaudeの名前の並びを少しだけ整理しておくとわかりやすいです。Anthropicには、ざっくり言うと「軽快で使いやすいSonnet」と「より強力なOpus」という系統があります。Sonnetはバランス型、Opusは最上位寄り、という理解でだいたい通じます。

だから、Sonnet 5がOpus 4.8に近いと聞くと、これはなかなかインパクトがあります。性能差が縮まるなら、日常的な用途では高価な最上位モデルを無理に選ばなくてもよくなるからです。AIの世界では、こういう“上位機の肩を叩く中位機”がいちばん実用的だったりします。ベンチマークの数字が少し良い、よりも、​使うときの財布への圧が小さいほうがずっと大事、という人は多いはずです。私もそう思います。

image_0003.png

記事で強調されているのは、Sonnet 5がagentic benchmarksでOpus 4.8に近づいたことです。agentic benchmarksというのは、モデルが単発で答えるだけでなく、道具を使いながら段階的に作業を進める能力を見るテストだと考えるとよいです。要するに、ただ文章がうまいだけではなく、「調べる」「考える」「手を動かす」を連続してやれるかを見るわけです。

ここがかなり重要です。最近のAIは、チャット相手として優秀なだけでは差がつきにくくなってきました。差が出るのは、むしろ長めの作業をどこまで任せられるかです。たとえばコード修正、複数ファイルの参照、ツール呼び出し、段取りを踏む調査。こういう場面では、モデルの“会話力”より“作業力”がものを言います。Sonnet 5がそこに食い込んできたなら、かなり実務向きだと見ていいでしょう。

しかも価格が攻めています。AnthropicはSonnet 5を、8月までの導入価格として100万トークンあたり入力 $2、出力 $10で提供します。トークンというのは、AIが文章を扱うときの細かい単位のことです。ざっくり言えば「読んだ量・出した量」に応じて課金されるイメージで構いません。

image_0004.png

この価格、AIを日常的に触る人にはかなり効きます。モデルの性能が少し上がっても、使うたびに請求が跳ねるなら、結局は社内で広がりません。逆に、導入価格が安いと「まず試そう」が起きる。そこからワークフローに組み込まれる。AIサービスは、性能だけでなく、この“試されやすさ”が普及を左右します。Anthropicはそこをよくわかっている感じがします。

私がこの発表でいちばん面白いと思うのは、AnthropicがSonnet 5を「中途半端な立ち位置」ではなく、かなり戦略的な主力として出してきたことです。安いだけのモデルでも、最強だけを追うモデルでもない。​十分強くて、十分安くて、しかも長い作業に向く。このバランスは、企業や開発チームにとって実はかなり刺さります。

もちろん、ここで注意したいのは、ベンチマークがすべてではないことです。得点が高いからといって、どんな現場でも期待通りに動くとは限りません。特にagentic系は、システムの組み方や指示の与え方でも結果が変わります。なので「Opusに迫るから万能」と受け取るのは早いです。とはいえ、性能差を価格差で埋められるなら、現場で選ばれるのはたいていそっちです。そこはかなり現実的な判断だと思います。

image_0005.png

Anthropicのこの打ち出し方は、AIモデル市場がだんだん成熟してきたサインにも見えます。昔は「より賢い」を競うだけでよかった。でも今は、賢さだけでなく、​継続利用のしやすさ、​ツール連携のしやすさ、​予算に収まるかまで含めて評価される。Sonnet 5は、その新しい競争軸にきれいに乗っている印象です。

8月までの導入価格という期限付きなのも、かなり商売上手です。限定オファーがあると、企業は「今のうちに試験導入しておこう」と動きやすい。AIの世界では、検討会議が長引くとそのまま何も始まらないことがよくあります。そういう意味で、この価格設定は単なる値引きではなく、​導入を前に進めるための仕掛けだと見るべきでしょう。

Sonnet 5は、派手に世界をひっくり返すタイプというより、「毎日使う人にとって、これがちょうどいい」と思わせるタイプです。こういうモデルが一番怖い。話題性は最上位モデルに譲っても、実際の利用量ではじわじわ勝つことがあるからです。AI製品の本当の勝負は、スペック表の上ではなく、運用の現場で決まる。Sonnet 5はそのことをかなりよく理解した登場だと感じます。

image_0006.jpg


参考: Anthropic Sonnet 5: It closes the gap with Opus 4.8, and is cheap until August

同じ著者の記事