世界の技術ニュースをリアルタイムでキャッチし、日本語でわかりやすく発信。AI・半導体・スタートアップから規制動向まで、グローバルテックシーンの「今」をお届けします。

2026-05-18

Hugging FaceのAIモデルに潜む“たった1行”の危険な改ざん

記事のキーポイント

Hugging FaceのAIモデルは、tokenizer.json というファイルを少し書き換えるだけで悪用される可能性がある
この攻撃は、モデルの出力を乗っ取ったり、アクセス先URLやAPIパラメータ、埋め込み資格情報を盗み見たりできるおそれがある
影響を受けるのは主に、ローカル環境で動かしているオープンソースモデル
Hugging FaceのInference APIのようなクラウド経由の実行は、この記事で紹介された手口の対象外
対策としては、署名付きモデルの利用、第三者モデルの検査、チェックサム確認が重要

たった1つのファイルでAIを“だまし”にいく話

今回の話、かなり面白くて、同時にちょっとゾッとします。
Dark Readingによると、Hugging FaceのAIモデルに含まれる tokenizer.json というファイルを、攻撃者がほんの少し改ざんするだけで、モデルの振る舞いを乗っ取れる可能性があるそうです。

Hugging Faceは、AIモデルや関連コンポーネントを配布する巨大なオープンソース基盤です。便利さの裏返しで、悪意あるモデルや改ざん済みファイルが紛れ込むリスクもあります。今回のポイントは、「モデル本体」だけでなく、モデルの周辺ファイルも危ないということです。ここが本当に重要だと思います。

tokenizerって何者？

まず、tokenizer はAIの“通訳”のようなものです。
AIモデルは、内部では文字をそのまま理解しているわけではなく、数字の並びとして扱います。その数字を、人間が読める文章に戻す役目を持つのが tokenizer です。

記事では、Hugging Faceの多くのモデルで tokenizer.json がこの変換ルールを持っていると説明されています。中には何万件もの対応表が入っていて、単語、単語の一部、制御用のトークンなどが含まれます。

つまりこのファイルは、見た目はただのテキストでも、実際には「モデルの出力をどう解釈するか」を決めるかなり重要な設定です。
個人的には、こういう“地味な設定ファイルが本体級に重要”というのが、セキュリティの怖いところだなと思います。

攻撃の仕組みはかなりシンプル

HiddenLayerの研究者が示したのは、攻撃者が tokenizer.json を入手して、たった1か所でも編集できれば、モデルの出力を直接コントロールできる可能性がある、という話です。

やり方のイメージはこんな感じです。

攻撃者がオープンソースモデルを入手する
tokenizer.json を少しだけ改ざんする
その改ざん済みモデルを公開リポジトリに再アップロードする
それを使った利用者が、知らないうちに“毒入り”モデルを動かしてしまう

記事では、この改ざんされた tokenizer.json は正規のものと構造的にほぼ同じなので、通常の配布フローをすり抜けやすいとされています。
これ、かなり厄介です。見た目が普通なら、チェックする側も疑いにくいですからね。

何が盗まれるのか

この攻撃で怖いのは、単にモデルの返答がおかしくなるだけではない点です。

HiddenLayerの説明では、攻撃者はMitM（man-in-the-middle）っぽい形で、ツール呼び出しの引数を横取りし、URLトークンを攻撃者のインフラ経由に向けることができる可能性があります。
要するに、モデルがどこにアクセスしたか、どんなAPIパラメータを使ったか、さらにはリクエストに埋め込まれた資格情報まで見えてしまうおそれがある、ということです。

ここは一般向けに言い換えると、

AIが見に行ったWebサイト
APIに送った情報
その中に混じっていた秘密情報

こうしたものが漏れるかもしれない、という話です。

AIを“賢いアシスタント”として使っているつもりが、裏では情報を抜かれる入口になりうる。かなり皮肉があります。

どの環境が危ないのか

この記事で大事なのは、影響を受けるのは主にローカル実行のモデルだという点です。

対象として挙がっているのは、Hugging Faceのモデルをローカルで動かす際に使われる以下の形式です。

SafeTensors
ONNX
GGUF

これらはHugging Faceでも広く使われていますし、LlamaCPPやOllamaのような、ローカルでオープンソースモデルを動かす仕組みにも関係します。

一方で、Hugging FaceのInference APIのようにクラウド側で実行するサービスは、この手口の直接の対象ではないと記事は述べています。
つまり、「自分のPCや自社環境にモデルを置いて動かす」ほど、この話は刺さるわけです。

何がそんなに危険なのか

この種の攻撃の嫌なところは、モデルが普通に動いてしまう可能性が高いことです。

動く。返事も返る。エラーも出ない。
でも内部では、出力や通信の一部が改ざんされているかもしれない。これでは気づきにくいです。

HiddenLayerの研究者は、tokenizer.json は「ただのプレーンテキストファイル」に見えても、実際には「デプロイしたシステムが何をするか」を決める重要な要素だと指摘しています。
このコメント、かなり本質的だと思います。セキュリティの世界では、**“見た目の重要度”と“本当の重要度”が一致しない**ことがよくあります。