世界の技術ニュースをリアルタイムでキャッチし、日本語でわかりやすく発信。AI・半導体・スタートアップから規制動向まで、グローバルテックシーンの「今」をお届けします。

2026-05-30

Claude Opus 4.8登場。Anthropicが「より賢く、より正直で、長い仕事に強い」新モデルを発表

Anthropicが、Claudeの最上位クラスにあたる新モデル Claude Opus 4.8 を公開しました。
ひとことで言うと、「前の版より、コード・自律作業・仕事での使い勝手がしっかり良くなった」 というアップデートです。

しかも面白いのは、ただモデルを新しくしただけではなく、使い方そのものもいくつか進化している点です。
個人的には、こういう「モデル本体の改良」と「周辺機能の改善」が同時に来ると、実際の体験がかなり変わるので、かなり重要な発表だと思います。

まず要点だけ

Claude Opus 4.8 は、Opus 4.7の後継モデル
coding、agentic tasks、自律的な仕事で性能が強化された
同じ価格のまま提供される
claude.ai では、Claudeにどれくらい頑張らせるかをユーザーが選べるようになった
Claude Code には dynamic workflows が追加され、超大規模タスクを扱いやすくなった
fast mode は、以前より安く使えるようになった
Anthropicは、Opus 4.8を より正直で、誤りを見逃しにくい モデルだと説明している

何が新しいのか

Claude Opus 4.8は、Opus 4.7の上位版です。Anthropicによると、ベンチマーク（性能テスト）全般で改善していて、特に次の領域が強化されています。

coding
プログラミングのコードを書いたり直したりする能力
agentic tasks
ツールを使いながら、自分で手順を考えて仕事を進める能力
（人間が細かく指示しなくても、ある程度「仕事を任せられる」感じ）
professional work
文章作成、調査、分析など、実務っぽい仕事
long-running work
長時間かかる仕事でも、途中で崩れにくい安定性

ここで大事なのは、単純に「賢くなった」だけではなく、協力相手としての質が上がったと強調している点です。
AIは、点数が高いだけでは実務では使いにくいことがあります。途中で話が飛んだり、勝手に自信満々で間違えたりすると、むしろ手間が増えるからです。Opus 4.8は、そのあたりの“お世話のしやすさ”が改善されているようです。

現場の声がけっこう興味深い

Anthropicは、早期テスターのコメントをかなり多く載せています。
これがなかなか面白いです。なぜなら、ベンチマークの数字より、「実際に触った人がどう感じたか」 のほうが、現場では効くことが多いからです。

たとえば、テスターの声では：

判断がよくなった
質問のタイミングが適切
自分のミスを自分で見つける
無理な計画にはちゃんとツッコむ
長い作業でも文脈やスタイルを保ちやすい
ツール呼び出しが効率的
法律・金融・分析系の仕事でも精度が上がった

といった評価が並んでいます。

特に印象的だったのは、
「自分で問題点を先に指摘する」 という評価です。
これは地味ですが、実務ではかなり大きいです。AIが間違った方向に進んでいるのに、ユーザーが最後まで気づかないのが一番怖いので、こういう性質はかなり価値があると思います。

「正直さ」をかなり重視している

Anthropicは今回、Opus 4.8の改善点として honesty（正直さ） を大きく打ち出しています。

ここでいう正直さは、「嘘をつかない」という単純な話だけではありません。
AIはときどき、証拠が薄いのに それっぽく結論を言ってしまう ことがあります。人間から見ると「堂々としていて頼もしい」ように見えて、実は中身が薄いことがある。これが厄介なんですよね。

Anthropicによると、Opus 4.8は：

不確実な部分を不確実だと伝えやすい
根拠の薄い主張をしにくい
書いたコードの欠陥を見逃してしまうことが、前モデルより約4倍少ない

とのことです。

この「4倍少ない」はかなり強い数字ですが、もちろんこれはAnthropicの評価に基づくものです。
とはいえ、AIに必要なのは“強気”より“誠実さ”だという方向性は、私はすごくまともだと思います。実務で本当に怖いのは、賢いふりをした雑さなので。

安全性・整合性の評価も実施

Anthropicはリリース前に、いつものように alignment assessment を行ったとしています。
alignment はざっくり言うと、AIの振る舞いが人間の意図や安全性に沿っているかを見る評価です。

今回の評価では、Opus 4.8は：

ユーザーの自律性を支える
ユーザーの利益を優先する

といった prosocial traits（協力的・社会的に望ましい性質）で高い結果を示したとのことです。

さらに、
deception（だますこと） や misuseへの協力 といった望ましくない挙動は、Opus 4.7よりかなり低く、Anthropicの別のモデル Claude Mythos Preview に近い水準だったと説明されています。

このへんは、派手さはないけれど重要です。
AIが強くなるほど、「何ができるか」だけでなく「何をやらせてよいか」が難しくなるので、安全面の強化は避けて通れません。

同時に出た新機能がかなり実用的

今回の発表は、Opus 4.8だけではありません。周辺機能の更新もあります。これが実はけっこう本命かもしれません。

1. dynamic workflows in Claude Code

Claude Code に dynamic workflows が追加されました。
これは、Claudeが大きな作業を自分で計画し、数百のparallel subagents（並列で動く小さな作業担当）を回しながら進められる機能です。

要するに、
「でっかい仕事を、分解して、同時並行でさばく」 仕組みです。

Anthropicは例として、数十万行規模のコードベース移行を、開始からマージまで進められると説明しています。
ここまで来ると、もはやちょっとしたアシスタントではなく、かなり本気の開発補助システムです。

個人的には、この方向性はかなりおもしろいです。AIの価値は「1回の回答のうまさ」だけでなく、大きな作業を最後まで運べるかにどんどん移っていると思います。

2. claude.ai で effort control

claude.ai と Cowork では、effort control が追加されました。
これは、Claudeが1つのタスクにどれくらい頑張るかを、ユーザーが選べる機能です。

高い effort
より深く考える。回答品質が上がる
低い effort
速く返る。レート制限を消費しにくい

つまり、
「急ぎの雑務は軽く」「難しい仕事は重く」 という使い分けがしやすくなりました。

こういう機能、地味ですがかなり便利そうです。
AIは毎回フルパワーで考えればいいわけではないので、用途に応じて力加減を変えられるのは、実際のユーザー体験を良くするはずです。

3. Messages API の拡張

開発者向けには、Messages API が更新されました。
これまではやりづらかった、会話の途中でClaudeの指示を差し替えることがしやすくなっています。

Anthropicによると、これによって：

prompt cache を壊さずに指示変更できる
ユーザー発話を挟まずに更新できる
権限、token budget、環境情報の更新などに使える

とのことです。

これはエージェント開発をしている人にはかなりありがたいはずです。
現実のシステムでは、途中で条件が変わるのは普通なので、そこに柔軟に対応できるのは実務向きです。

effort の考え方も整理されている

Opus 4.8はデフォルトで high effort になっています。
Anthropicはこれを、品質と使いやすさのバランスがいちばん良いと判断しているようです。

また、より重い設定として：

extra（Claude Codeでは xhigh）
max

も選べます。

難しいタスクや長時間の非同期ワークフローには extra を勧めていて、さらにClaude Codeでは高effort向けにrate limitsも増やしたとのことです。

要するに、
「ちゃんと考えさせるなら、そのぶんコストもかかるよ」 という現実的な設計です。
ここはとても正直で、私は好感を持ちました。

価格は据え置き

うれしいポイントは、通常利用の価格はOpus 4.7と同じだということです。

$5 / 100万 input tokens
$25 / 100万 output tokens

fast mode は：

$10 / 100万 input tokens
$50 / 100万 output tokens

となっています。

しかも fast mode は、前のモデルより3倍安いとされています。
速度を優先したい場面ではかなり使いやすくなりそうです。

どういう人に効きそうか

今回のアップデートは、特に次のような人に刺さりそうです。

エンジニア
コード修正、移行、大規模リファクタリング
リサーチや分析をする人
長時間の調査、資料作成、要点整理
法律・金融・専門業務の現場
精度と根拠が大事な仕事
AIエージェントを作る開発者
ツール呼び出しや途中更新の柔軟性が重要

特に、「長く回し続ける仕事」 に強くなったのは大きいです。
AIは短いQ&Aだけでなく、途中で詰まらずにタスクを完走できるかが本番なので、ここが改善されると実用性はかなり上がります。

ただし、まだ“完成形”ではない

Anthropic自身も、Opus 4.8は modest but tangible improvement、つまり
「控えめだけど、ちゃんと体感できる改善」 だと説明しています。

そして同時に、今後の方向としては：

Opusと同等の性能を、もっと安く
Opusよりさらに高性能な新しいクラスのモデル
Mythos-class の安全対策を整えて広く提供

を進めるとしています。

つまり、Opus 4.8はゴールではなく、次の段階への橋渡しという位置づけです。
このあたり、AI業界らしく「まだまだ先がある」感じで、ちょっとワクワクします。

まとめ

Claude Opus 4.8は、派手な“革命”というより、実務で効く改善を積み重ねたアップデートです。
でも、AIはこういう地味な改善のほうが、結局いちばん効くことが多いんですよね。

特に今回は、

よりよい判断
より高い正直さ
より長いタスクへの耐性
より使いやすいエージェント機能

がそろっていて、「AIを便利なおもちゃから、仕事相手へ寄せていく」 方向がはっきり見えます。

個人的には、Opus 4.8の価値は「賢さ」そのものより、安心して任せられる感じが増したことにあると思います。
AIは結局、最後まで信頼できるかどうかが勝負ですからね。

参考: Introducing Claude Opus 4.8

同じ著者の記事

Excelのフォントが変わる原因を、.xlsxを解凍して確かめてみた

「テーマフォントが原因」というところまでは、探せば辿り着ける。だが実際にファイルの中で何が参照し合っているのかを見た人は少ない。.xlsxはただのZIPなので、覗くのに5分もかからない。手元の適当なブックで試すなら、拡張子を`.zip`に変えるか`unzip`コマンドを叩くだけでいい。 ``` $ unzip -l sample.xlsx Length Date Time Name --------- ---------- ----- ---- 1234 2026-07-01 09:00 xl/theme/theme1.xml 5678 2026-07-01 09:00 xl/styles.xml ... 2345 2026-07-01 09:00 xl/worksheets/sheet1.xml ``` 犯人は`xl/theme/theme1.xml`にいる。中を`cat`すると、こんな塊が出てくる。 ```xml <a:fontScheme name="Office"> <a:majorFont> <a:latin typeface="

papoo.work

Claude の Effort、実は3段階じゃない——xhigh/maxまで含めた5段階の使い分けとAPI仕様を深掘りする

以前の記事「[Claude の effort ってどう効くの？](https://note.com/modern_ferret431/n/nc8e88b771ab0)」では、Effortパラメータを Low / Medium / High の3段階として紹介した。実際のClaude APIはもう一段深い。現行モデル（Opus 4.8/4.7、Sonnet 5、Fable 5）では low / medium / high / xhigh / max の5段階が存在し、しかも「thinkingの予算」だった旧`budget_tokens`とは効かせ方そのものが違う。本稿ではAPI仕様に基づいて、モデル別の対応状況・挙動の違い・実運用での設計指針を整理する。旧世代（Sonnet 4.5以前）の extended thinking は `thinking: {type: "enabled", budget_tokens: N}` という固定トークン予算の指定だった。「thinkingにいくら使うか」だけを制御する、いわば一次元のノブだ。 Opus 4.6以降ではこれが非推奨化

papoo.work

Claudeの「超過課金」は自動発生しない——note記事の補足と2026年6月の仕様変更

先日、[「Claudeは weekly limit や 5hours limit を突き破ったときのペナルティ料金が半端ない」](https://note.com/modern_ferret431/n/n821d3055d109) という記事が話題になった。Claude CodeやOpusでコードベース解析を回していると、10分足らずで従量課金が発生し得るという警告は実体験として貴重だが、エンジニアが実際に運用判断をする上で誤解しやすいポイントがいくつかある。本記事はその補足として、Anthropic公式ドキュメントに基づき仕組みを整理する。最大の誤解ポイントはここ。Claude Pro/Maxで週次・5時間の利用上限に達しても、Usage credits（超過課金）を明示的に有効化していない限り、追加料金は一切発生しない。上限に達した場合の既定動作は「リセットまで待つ」だけで、勝手にAPI従量課金へ切り替わることはない。有効化するには以下の手順が必要: `Settings > Usage` から Usage credits セクションで Enable をクリック

papoo.work

【2026年7月版】Outlookが「起動しない・クラッシュを繰り返す」最新事情 — 6月末の一斉クラッシュはビルド2605が原因、直し方はほぼ一択

「昨日まで普通に使えていたClassic Outlookが、右クリックした瞬間に落ちる」「起動してもすぐ強制終了し、次はセーフモードで開く」——2026年6月末から、この手の悲鳴がまた一気に増えた。半年前・1年前に書かれた「Outlookが起動しない完全解決ガイド」的な記事が今また読まれているのは、まさに今、Classic Outlookのクラッシュが立て続けに起きているからだ。本稿は、2026年前半に発生した複数のクラッシュ事案を発生時期・影響ビルド・原因・修正状況で整理し直し、「自分のケースはどれで、何をすれば直るか」を最短で切り分けられるようにしたものだ。結論から言うと、直近の主犯は更新プログラムの回帰（リグレッション）で、多くは“Officeを最新へ更新するだけ”で直る。設定を9個いじる前に、まずここを見たほうが早い。 > ⚠️ 先に結論: 2026年6月29日ごろから急にClassic Outlookが落ち始めたなら、疑うべきは自分の設定ではなく **Microsoft 365 Apps バージョン2605（Build 20026.20182

papoo.work

【2026年7月版】Outlookの「送信済みメールが消える」が再燃 — 犯人はWindows更新プログラム KB5074109 の可能性

「送信は成功したのに、送信済みアイテムに残っていない」——Outlookの定番トラブルが、2026年に入ってから再び相談件数を増やしている。半年前(2026年1月)に出回った解説記事の手順は今でも基本として有効だが、2026年に急増した“送信済みが消える”の主犯は、従来の設定ミスではなく Windows のセキュリティ更新プログラムそのものであることが分かってきた。本稿はその現況を、切り分け順に整理し直したものだ。 > ⚠️ 先に結論: 1月中旬以降にClassic Outlook(デスクトップ版)で急に「送信済みに入らない」「Outlookが固まる」が始まったなら、まず疑うべきは自分の設定ではなく 更新プログラム KB5074109 と PSTファイルの置き場所(OneDrive配下かどうか) だ。設定を10個いじる前に、ここを先に見たほうが早い。 --- 2026年1月のWindowsセキュリティ更新 KB5074109 導入後、**Classic Outlookで送信メールが「送信済みアイテム」に記録されない／Outlookが終了しない・フ

papoo.work

【続報】サナエトークン、ついに「当事者2人の法廷闘争」へ――三崎優太氏が溝口勇児氏に内容証明、いまどこまで進んだか

前回まで、私たちはサナエトークン騒動を「補償」「金融庁」「高市首相の否定」という3つの軸で追ってきた。補償は6月10日に申請サイトが開き、金融庁の損失相談は6月時点で5件、首相は国会で改めて全面否定――というのが直近の現在地だった。ところが騒動はここへ来て、まったく別の局面に入っている。行政・補償の話から、当事者どうしの個人間紛争、それも法廷闘争へと重心が移ったのだ。本稿はその続報である。 https://papoo.work/doc/7de9f0cf1b564dc9 実業家の三崎優太氏（元「青汁王子」）が、実業家の溝口勇児氏に内容証明を送付したと明かし、「きっと裁判になる」と法廷闘争を予告した。三崎氏は溝口氏とみられる人物の会議音声を公開し、「責任を他人になすりつけている（＝トカゲの尻尾切り）」と批判。溝口氏は「編集で切り取っている」「補償対応はやっている」と反論した。 6月26日、三崎氏は両者が共同運営していたYouTube番組「REAL VALUE」からの脱退を表明。ただし本稿執筆時点（7月7日）で、**正式な「提訴」の公

papoo.work

ブラウン大学で起きた「AIカンニング」騒動、大学の信頼はどう守るのか

ブラウン大学の経済学者ロベルト・セラーノ教授が、担当科目の試験で少なくとも50人がAIを使って不正をしたと訴えている。問題になったのは、持ち帰って解く形式の試験。自宅でじっくり考えられる反面、ChatGPTのようなAIを使いやすい。期末試験では平均点が一気に落ち、欠席者の多くが前回満点だったことから、教授は「証拠は圧倒的」と見ている。ブラウン大学の反応は鈍く、教授は「大学全体で学問の誠実さを守る議論が必要だ」と主張している。背景には、米国の名門大学で広がるAI利用の誘惑と、教育のあり方そのものを揺さぶる問題がある。ブラウン大学で起きたこの話、かなり重いです。しかも、ただの「試験でズルした人がいました」という話では終わりません。大学が長年かけて築いてきた信頼、つまり「ここで学んだ学生の成績には意味がある」という前提そのものが、AIの登場でぐらついている。この記事は、その現場で何が起きているのかをかなり生々しく伝えています。中心にいるのは、ブラウン大学の著名な経済学者ロベルト・セラーノ教授です。彼は、数学的経済学の上級学部生向け講義 ECON 1170 を担当していて、

papoo.work

AIにMRIを読ませたら、医師と真逆の答えが出た話

肩が痛い。だからMRIを撮った。そこまではよくある話です。ところがこのブログ記事は、そこで終わりません。著者はそのMRI画像を、OpenAI系のモデルではなく、Claude Code上で動かしたOpus 4.8に読ませて、「もう一つの診断」を引き出そうとします。で、出てきた答えがかなり衝撃的でした。医師は「腱板の部分断裂（Grade III）」と見たのに、AIは「腱は保たれている」と判断したんです。この差、かなり大きいです。しかも著者は、ただAIに雑に投げたわけではありません。DICOM形式のMRIデータを用意し、Claude Codeに必要なパッケージを入れさせ、かなり本気で解析させています。単なるお遊びではなく、「AIが医療画像をどこまで読めるのか」を自分の体で試した記録、と言ったほうが近いです。肩の痛みでMRIを撮った著者が、AIに画像の再読影をさせた人間の医師は「Grade IIIの部分断裂」と判断した Opus 4.8は最初、「腱は正常」と報告したその後、別の条件で再比較させた結果、AIは「明らかな断裂は見当たらない」と結論づけたただし著者自身は、AIも医師も完全に

papoo.work

AIコーディングは「レビュー」より「テスト」で殴るほうが強い、という話

著者は、AI coding を使っていると「人間なら即クビ」レベルの妙な挙動に何度も遭遇したが、それでも利用をやめるどころか、さらに使い込むようになった。この記事の中心テーマは、AI にコードを書かせるときは code review 以上に test process が大事 だ、という主張。その根拠として、著者は昔働いていた CPU 設計会社 Centaur のテスト文化を紹介する。そこでは、手書きテストより fuzzing や random testing を重視し、unit test はほぼ使わず、専任の test engineer がいた。著者は、AI 時代の開発でも「人間が全部レビューする」より、「大量の自動テストで叩く」ほうが現実的で、しかも強いと考えている。ただし、これは単なる理想論ではなく、実際にバグを見つけて直してきた現場の感覚から来ている。本文を読んでまず面白いのは、著者の出発点がかなり変わっていることです。AI coding を「便利な補助輪」ではなく、かなり攻めた実験装置として見ています。しかも、その最初の印象がすごい。バ

papoo.work

Apple Neural Engineの中身を、かなり踏み込んで覗いた研究

Appleの「Neural Engine」、通称ANEは、iPhoneやMacの中で静かに働く専用チップです。顔認識、写真の補正、音声処理、生成AIの一部まで、裏側でかなり多くの仕事を抱えています。ふだんはCore MLというApple公式の仕組み越しにしか使えないので、一般の開発者から見ると「中はブラックボックス」の代表格でした。今回のarXiv論文は、そのブラックボックスをかなり本気で分解したものです。しかも単なる憶測ではなく、Apple silicon上での直接計測と、private runtime、compiler、kernel driver、firmwareの静的解析を組み合わせている。こういう研究は地味に見えて、実はとても面白いです。Appleが“使わせるつもりのない層”にまで手を伸ばして、仕組みを記述しているわけですから。この論文は、Apple Neural Engineのアーキテクチャ、プログラミング方法、性能の限界をまとめた「リバースエンジニアリングのガイド」です。対象はA11世代のiPhone/iPadチップからA18、そしてM1からM5まで。かなり広い。特に

papoo.work