世界の技術ニュースをリアルタイムでキャッチし、日本語でわかりやすく発信。AI・半導体・スタートアップから規制動向まで、グローバルテックシーンの「今」をお届けします。

2026-05-13

Mozillaが見た「Claude Mythos」の実力：20年前のバグまで掘り当てたAIの話

記事のキーポイント

Mozillaが、Anthropicの非公開AIモデル Claude Mythos Preview を使ってFirefoxのセキュリティ調査を実施した
その結果、423件のセキュリティバグ修正につながり、うち 271件 はMythosに関連づけられた
その中には、20年前から残っていたバグ も含まれていたという
以前のAIは「それっぽいけど間違い」な提案、いわゆる slop が多かったが、今回のモデルはコードの深い部分まで追えるほど進化したとMozillaは評価
Anthropicはこのモデルを一般公開しておらず、限られた企業だけ が使える状態になっている

20年もの間、見つからなかったバグをAIが見つけた

Mozillaがかなり面白い発表をしました。
Firefoxを作っているMozillaが、Anthropicの未公開AIモデル Claude Mythos Preview を使ったところ、長年見逃されていたセキュリティ上の問題を大量に見つけた というのです。

しかも、その中には 20年前から存在していたバグ まで含まれていたそうです。
この手の話、正直かなりインパクトがあります。20年というのは、ソフトウェアの世界ではもはや“化石”みたいなものです。それをAIが掘り当てたとなると、「AIって文章を書く道具でしょ？」というイメージをかなり更新させられます。

Mozillaによると、4月のFirefoxリリースで修正したセキュリティバグは 合計423件。そのうち 271件 は、Claude Mythos Previewを使った作業に結びついているとのことです。
1月は修正件数が25件だったそうなので、伸び方がかなり急です。3月でも76件だったので、AIの効き方が一段と強くなっているのがわかります。

何がそんなにすごいのか

ここで大事なのは、AIが「勝手にバグを直した」わけではないことです。
あくまで、人間が見つけきれなかった問題の候補をAIが発見する、という使われ方です。

セキュリティの世界では、fuzzers というテスト手法があります。
これは、ソフトウェアにめちゃくちゃな入力を大量に投げ込み、壊れ方を見てバグを探す方法です。いわば「わざと意地悪なテストをしまくる」感じですね。

Mozillaは、あるバグについて「fuzzersでも何年も検出されなかった」と述べています。
ここがかなり重要です。つまり、従来の自動テストでは届かなかった場所に、AIが踏み込めたわけです。

以前のAIは“それっぽいだけ”だった

Mozillaの説明で印象的だったのは、以前のAIによるバグ報告は “slop” だった、という点です。
slopは雑な出力、つまり「もっともらしいけど中身が怪しい」ものを指します。

これはAIあるあるです。
文章は自信満々なのに、よく見るとズレている。コードレビューでも、バグ報告でも、こういう“見た目だけ立派”な回答は本当に厄介です。現場の人からすると、検証コストが増えるだけなので、むしろ邪魔になることもあります。

でも今回のMythosは違った、とMozillaは言っています。
広大なブラウザのコードベースを読み解き、深く埋もれた欠陥まで見つけられた。
この「コードベースを読み解く」というのは、単に検索が速いという話ではありません。何万行、何十万行ものコードのつながりを追いかけ、どこでセキュリティが破れるのかを見極める力が必要です。そこまで来ると、かなり“相棒感”があります。

なぜMythosは一般公開されていないのか

Anthropicは、このMythosモデルを公開していません。
理由は、強力すぎると悪用されるリスクがある からだと説明しています。具体的には、国家安全保障やオンライン犯罪に関わる危険があると考えているようです。

このあたりは、AIの進化が速いほど避けて通れない話です。
強力なツールは、守りにも使える一方で、攻撃にも使えてしまいます。
Mozillaのような大きな開発組織にとっては恩恵が大きいけれど、同じ能力が悪意ある人の手にも渡ると面倒なことになる。だからこそ、限られた企業だけにアクセスを許しているのでしょう。