Sonnetがついに「Opusでいいじゃん」って言われ始めた件、実際どうなのか集めてみた
2026年6月末にSonnet 5が出て以来、あちこちで「もうOpusいらないんじゃないか」という声を見るようになった。正直、この手の「新型は前世代を食う」論は毎回出てくるので話半分に聞いてたんだけど、今回は言ってる人の顔ぶれが違う。エンタープライズの導入事例から個人ブロガーの生々しい愚痴まで、実際にClaude Codeで両方回した人たちの声を拾ってみたら、思ったより解像度の高い話が出てきたので整理する。 まず数字。SWE-bench Proのエージェント型コーディングでSonnet 5は63.2%、Opus 4.8は69.2%。これだけ見ると6ポイント差はまだ結構ある。一方でHumanity's Last Examにツールを持たせた条件だとSonnet 5が57.4%、Opus 4.8が57.9%とほぼ同着。知識労働系のGDPval-AA v2に至ってはSonnet 5の1,618に対してOpus 4.8が1,615で、数字上はSonnet が上回っている場面すらある。 つまり「全部の指標で肉薄した」んじゃなくて、タスクの種類によって差の出方がバラバラというのが実態に近い。
papoo.work