AnthropicのFable 5が記録更新、それでも人間の仕事はまだ消えない
AIが「仕事をどこまで代わりにこなせるか」を測るとき、だいたい話がふわっとしがちです。 でも今回のZDNETが取り上げた話は、かなり手触りがあります。Anthropicのモデル「Fable 5」が、フリーランスの実務をどれだけ自動化できるかを測るベンチマークで新記録を出したのです。とはいえ、だからといって人間の仕事を置き換えられる段階かというと、答えはまだ「いいえ」です。 Fable 5が、フリーランス作業の自動化性能を測る指標で16.1%を記録した これは過去の記録を大きく上回り、AIの仕事代行能力が急速に伸びていることを示す ただし、16%は100%ではないし、実運用には品質確認やセキュリティなど別の壁がある 人間の評価者をAIに置き換える実験は失敗していて、AIがまだ苦手な領域もはっきりしている 仕事の種類によっては、AIが数分で終えるものもあれば、今も手が出ないものがある この話、数字だけ見ると「AIすごい」で終わりそうですが、私はむしろ「AIの得意・不得意がかなり具体的に見えてきた」のが面白いと思いました。夢物語ではなく、かなり現実的な話です。 今回の中心にあるのは、CAIS
papoo.work