米テックメディアのDigital Trendsが紹介したのは、かなり象徴的なニュースでした。中国のAIラボ Z.ai が開発した最新モデル GLM-5.2 が、サイバーセキュリティの領域で Anthropic の最上位モデル Claude Mythos に肩を並べた、という内容です。
ここで大事なのは、「AIが賢いかどうか」ではなく、「安全なソフトウェアを見つけるのがうまいかどうか」です。一般の会話や文章生成ではなく、プログラムの穴を探す力。これが今、かなり高く評価されているわけです。

ソフトウェアの脆弱性は、たとえば家のドアの鍵のかかりが甘いようなものです。普段は気づかなくても、悪意のある人が見つければ侵入経路になる。企業はそれを公開前に、あるいは攻撃される前に見つけて直したい。だから、脆弱性を素早く拾えるAIは、それだけで実用価値が高い。しかも、守る側にとってはかなり切実な道具です。
Wall Street Journal の報道によると、セキュリティ研究者たちは GLM-5.2 がソフトウェアのバグ発見で Mythos と同等レベルだと見ているそうです。しかも、ベンチマーク上では Claude Opus 4.8 を上回るケースもあるとのこと。ベンチマークはAIの成績表みたいなものですが、数字が良いからといって何でも完璧というわけではない。それでも、この分野でここまで迫ってきたのはかなり印象的です。

さらに面白いのは、GLM-5.2 が open-source だという点です。これは「設計図が公開されていて、誰でも手元で動かせる」タイプのAIです。企業にとっては、自社サーバーで回せるので扱いやすい。一方で、悪用する側にも使いやすい。ここが今回のニュースの少しゾッとするところです。強いAIが公開されることは、守る側にも攻める側にも武器を配ることになりうる。技術はたいてい、きれいに善悪を分けてくれません。
とはいえ、この記事は「中国がAI全体で米国を追い抜いた」とは言っていません。そこはかなり慎重です。GLM-5.2 は、Anthropic や OpenAI が得意とする広い意味での推論や総合力ではまだ遅れている。それでも、サイバーセキュリティのように現実の損害に直結する分野では、少しの差がものすごく大きい。だからこそ、今回の接近は軽く見ない方がいいと思います。

背景にあるのは、AI業界の競争のしかたが変わってきたことです。米国側では Anthropic や OpenAI が、国家安全保障の観点から最先端モデルへのアクセスを絞る動きを見せています。一方、中国側では、ダウンロードして使える強力な open-weight モデルを次々に出している。open-weight は、モデルの重み、つまり学習済みの中身に相当する部分を公開する方式で、要するに「持ち帰って自由に使える」感覚に近いです。
この対比はかなり興味深いです。米国は「強すぎるものを慎重に扱う」方向、中国は「広く配ることで勢いを取る」方向。どちらが正しいかは簡単に言えませんが、少なくとも市場と研究コミュニティに与えるインパクトは全然違う。個人的には、こういう差が数か月単位で埋まっていくのが、今のAI競争のいちばん不気味で、いちばん面白いところだと思います。
記事では、Elon Musk の発言にも触れています。彼は、中国のAIラボが Anthropic の旗艦モデルにベンチマーク上で追いつくのは2027年初頭あたりではないか、と述べたそうです。これに対して Zhipu AI の創業者 Tang Jie は、そんなに時間はかからないと反応した。やり取りとしては、かなり挑発的で、いかにも今のAI業界らしい火花です。

Musk はその後、ベンチマーク上で並ぶことと、「本当に役に立つ」ことは別だとも言っています。ここはわりと本音でしょう。AIの世界では、数字だけならいくらでも盛れる。でも、実際に仕事で使ってお金を生むかどうかは別問題です。Anthropic が「有用な知能」を重視してきた、という彼の評価にも一理あると思います。
ただ、今回の GLM-5.2 の話は、数字の話にとどまりません。脆弱性を見つけるというのは、実務ではかなり価値が高い。派手な雑談能力より、むしろ地味で危ない仕事をどこまで正確にこなせるかの方が、今後のAIの本当の勝負どころになっていくのではないでしょうか。そう考えると、「中国のAIが追いついた」というより、「実戦で効く能力はもう世界中で拮抗し始めている」と見た方が、実態に近い気がします。

面白いのは、AIの競争がだんだん「誰が一番賢いか」から「誰がどの現場で強いか」に移っていることです。文章作成ではA社、コード補助ではB社、脆弱性発見ではC社、というふうに、得意分野が細かく分かれていく。そうなると、単純な序列では語れなくなる。今回のニュースは、その変化をかなりわかりやすく示していると思います。
結局のところ、GLM-5.2 が Anthropic の Mythos に並んだことは、中国AIの全面勝利を意味するわけではありません。でも、米国が安全保障を理由に最先端モデルを囲い込もうとしている間に、中国は配布可能な高性能モデルで現実の用途を詰めてきた。その差のつけ方は、かなりしたたかです。AIレースは、まだ米国優位と言ってよいでしょう。ただし、その優位はもう「安心して見ていられる差」ではない。そこが今回のいちばん大きなポイントだと思います。

参考: Chinese AI lab says it can match Anthropic’s all-poweful Claude Mythos at sniffing security bugs