PaPoo
cover
technews
Author
technews
世界の技術ニュースをリアルタイムでキャッチし、日本語でわかりやすく発信。AI・半導体・スタートアップから規制動向まで、グローバルテックシーンの「今」をお届けします。

AnthropicのFable 5が記録更新、それでも人間の仕事はまだ消えない

AIが「仕事をどこまで代わりにこなせるか」を測るとき、だいたい話がふわっとしがちです。
でも今回のZDNETが取り上げた話は、かなり手触りがあります。Anthropicのモデル「Fable 5」が、フリーランスの実務をどれだけ自動化できるかを測るベンチマークで新記録を出したのです。とはいえ、だからといって人間の仕事を置き換えられる段階かというと、答えはまだ「いいえ」です。

まず押さえたいポイント

この話、数字だけ見ると「AIすごい」で終わりそうですが、私はむしろ「AIの得意・不得意がかなり具体的に見えてきた」のが面白いと思いました。夢物語ではなく、かなり現実的な話です。

何を測ったのか

今回の中心にあるのは、CAIS(Center for AI Safety)が公開した「Remote Labor Index(RLI)」というベンチマークです。
ベンチマークというのは、AIの実力を比べるためのテスト集のようなものです。

RLIが見ているのは、単純なクイズの正答率ではありません。
「実際にお金を払う価値があるフリーランスの仕事を、AIがどれくらい片づけられるか」を測っています。たとえば、グラフィックデザイン、データ分析、動画制作、フロアプラン作成のような作業です。

しかも評価がわりと厳しい。AIが作った成果物は人間が見て、プロの仕事として受け入れられる水準かどうかを判断します。
ここが重要で、ただ“それっぽい”だけでは足りません。クライアントが実際に「これでOK」と言うかどうかを見ているわけです。

Fable 5はどれだけ強かったのか

CAISのテストでは、Fable 5に加えてOpenAIのGPT-5.5、AnthropicのOpus 4.8も比較対象になりました。
やらせた課題は、婚約指輪の3Dモックアップ作成、動画広告の制作、間取り図の作成など。人間のフリーランサーに依頼するのと似たように、関連ファイルや前提情報も渡しています。

その結果、Fable 5の自動化率は16.1%でした。これはベンチマーク上の新記録です。
Opus 4.8は8.3%、GPT-5.5は6.3%。Fable 5がかなり先頭に立った形です。

CAISは、RLIが公開された当初の上限は2.5%だったとも述べています。さらに、その後の公開記録も4.17%程度だったとのこと。
つまり、半年足らずで4倍以上に伸びた。これは派手な数字です。AI業界が「急速に進歩している」と言うときの、かなり具体的な証拠になっています。

個人的には、この伸び率がいちばんぞっとします。
AIの進化って、見た目の変化より「業務の一部を、いつの間にかかなり自然に肩代わりしている」方向で効いてくるんですよね。気づいたら、地味な作業が消えている。そういう怖さがあります。

でも、なぜまだ人間を置き換えられないのか

ここが一番大事です。
16.1%という数字は強いですが、当然ながら仕事の置き換え率としては全然足りません。10件の仕事のうち1〜2件に近いわけで、残りはまだ人間が必要です。

image_0001.jpg

しかも、実際の仕事は「成果物を作る」だけでは終わりません。
クライアントとのやりとり、納期管理、予算調整、途中の修正、セキュリティ配慮、ファイル管理、そして「これで本当に大丈夫か」を判断する確認作業がある。AIが強くなったとしても、仕事全体を丸ごと回すにはまだ穴が多いわけです。

CAISは、人間の評価者をLLM judge、つまり別のAIで置き換えようとする試みもしたそうですが、うまくいかなかったといいます。
評価そのものが、ただ見るだけの作業ではない。正しいアプリを開き、ファイルを扱い、専門職のように判断する必要がある。ところが、その「パソコンを使いこなして仕事をする」能力こそ、今のAIがまだ弱い、とCAISは説明しています。

この指摘はかなりリアルです。
AIは文章をそれっぽく返すのは上手い。でも、実務って「ファイルAを開き、Bを確認し、Cを修正し、Dと照合する」みたいな泥臭い連続です。そこに弱さがある。派手なデモの裏側にある現実です。

仕事を奪うというより、仕事の形を削るのかもしれない

とはいえ、「だから心配しなくていい」とは全く思いません。
むしろ逆で、AIが全部を置き換えるわけではないからこそ、部分的に仕事を削っていく可能性が高いと思います。

たとえば、ある会社がすでにAIを業務に組み込んでいて、画像案のたたき台作成や簡単な動画素材づくり、データの下調べをAIに任せているとします。そういう会社では、フリーランスに外注していた一部の仕事が減るかもしれません。
全部が消えるのではなく、「この作業はもうAIで足りるよね」が少しずつ増える。現場では、そのほうが現実的です。

しかもCAISは、「人間にとって速い仕事がAIにとっても簡単とは限らない」とも指摘しています。
たとえば、楽譜の書き起こしやリアルタイムゲームのプレイテストのように、人間には比較的短時間でもAIには難しい作業がある。一方で、デジタルアートやコーディングのように、人間なら何時間もかかるのにAIは数分で終えるものもある。

この差が面白い。
「時間がかかる仕事=AIが苦手」と単純には言えないんです。仕事の性質によって、AIの得手不得手はかなりバラバラ。だからこそ、業界ごとに影響の出方が全然違ってくるはずです。

先の話をすると、伸びしろはまだある

CAISは、今のAIのボトルネックが「コンピュータを実際に操作して仕事を回す力」にあると見ています。
もしこの部分がさらに改善されれば、今はAIに難しいとされる作業も、将来は普通にできるようになるかもしれない。AnthropicもOpenAIも、この方向のモデルにかなり投資していますから、可能性はあると思います。

だから、今回の16.1%は「もう安心」ではなく、「まだ序盤なのにこの伸び方か」という話です。
個人的には、ここがいちばん怖いし、同時に面白いところでもあります。AIは“完成品”として語られがちですが、実際は仕事の中の細かい部品を少しずつ奪っていく存在なんですよね。

ZDNETの記事は、Fable 5の新記録を単なる称賛で終わらせず、「でも人間はまだ必要だ」と釘を刺しています。
このバランス感覚は大事です。AIはたしかに強い。でも、現時点ではまだ“会社の仕事を丸ごと任せる相棒”ではない。せいぜい、かなり優秀な補助役です。しかも、その補助役はものすごい勢いで賢くなっている。そこが本質だと思います。


参考: Fable 5 just set a new AI freelance work performance record - but it can't replace humans yet

同じ著者の記事