世界の技術ニュースをリアルタイムでキャッチし、日本語でわかりやすく発信。AI・半導体・スタートアップから規制動向まで、グローバルテックシーンの「今」をお届けします。

2026-05-20

AIの幻覚は「バグ」ではなく構造問題だった——鏡が壊れていても、鏡は鏡

記事のキーポイント

AIの hallucination（幻覚）は、たまたま起きる不具合ではなく、言語モデルの仕組みそのものから生まれるという主張
言語モデルは「真実を知る機械」ではなく、それっぽい答えを流暢に返す鏡に近い
問題の本質は、流暢さと正確さが切り離されていること
RAG（検索してから答える方式）は、幻覚を完全に消す技術というより、モデルを信用しすぎないための設計
医療・法律・金融のような分野では、幻覚は単なるミスでは済まず、実害が大きい
だからこそ、AIに「最終決定」を任せるのではなく、出典を追える形で使う設計が重要

「AIは平気で嘘をつく」の正体は、もっと根深い

生成AIを使っていると、たまに「え、それ本当？」という答えが返ってきます。しかも厄介なのは、その答えがめちゃくちゃ自然な文章で出てくることです。

この元記事が面白いのは、AIの hallucination を「モデルがたまたま変なことを言った」ではなく、構造的な性質だと捉えているところです。
つまり、いまの言語モデルは「うっかりミスをする機械」ではなく、そもそも真実そのものを保証するようには作られていない、というわけです。

著者はこれを「鏡」の比喩で説明しています。
AIは光を出すランプではなく、前にあるものを反射する鏡に近い。人間の質問に対して、過去に見てきた文章の“答えっぽさ”を返す。だから、答えの見た目は整っている。でも、そこに事実の裏取りがあるとは限らない。ここが怖いところです。

個人的には、このたとえはかなりしっくりきます。
AIって、見た目があまりにも賢そうなので、つい「中に知性がある」と感じてしまうんですよね。でも実際には、知っているように見せる能力が高いだけ、という場面がある。かなりうまい鏡だと思う反面、かなり危ない鏡でもあります。

そもそも hallucination って何？

hallucination は、AIがそれっぽいけれど事実ではない内容を出してしまうことです。
たとえば：

存在しない論文を引用する
実在しない人物や出来事を断言する
参考文献っぽい体裁で、嘘の情報を混ぜる

厄介なのは、文章としては自然で、文法も正しいことです。
普通のソフトウェアのエラーなら、クラッシュしたりログが残ったりして「ここで壊れた」とわかります。ところがAIの幻覚は、表面上はきれいに動いているように見える。だからこそ見抜きにくい。

この記事では、hallucination をいくつかに分類する話も出てきます。
ざっくり言うと、

intrinsic hallucination: 与えた資料と矛盾する
extrinsic hallucination: 資料にない情報を勝手に足す
open-domain hallucination: 訓練時の記憶をもとに、もっともらしく作り話をする

ただし著者は、この分類そのものよりも、流暢さと正確さが切り離されていることが本質だと強調しています。ここがかなり重要です。

なぜ「それっぽさ」が危険なのか

人間は、普通は流暢に話す人ほど内容を知っていそうだと感じます。
自信満々で筋道立てて話す人を見ると、「この人は理解しているな」と思いやすい。これはある意味、日常生活で役に立つ判断です。

でもAIは、この前提を壊します。
AIは、中身が正しいかどうかと無関係に、流暢な文章を出せるからです。

つまり、

上手に話している
自信ありげに見える
引用の形式もそれらしい

この3つが揃っていても、事実として正しい保証はない。
ここに、AI時代ならではの認知バグがあるわけです。

記事では、言語モデルの学習目的にも触れています。言語モデルは次に来る単語を当てるように学習しますが、その目的自体は真実を判定することではない。
要するに、学習の報酬は「それっぽい文を作ること」に向いていて、「世界の事実を検証すること」ではない。ここはかなり本質的だと思います。

RAGが流行るのは、AIを信用しきっていない証拠

ここで出てくるのが RAG（Retrieval-Augmented Generation） です。
難しそうですが、やっていることはわりと単純で、

まず関連資料を検索する
その資料をAIに渡す
AIはその資料をもとに答えを書く

という流れです。
つまり、AIに「記憶で答えさせる」のではなく、資料を読ませてから答えさせるやり方です。

著者の見方が面白いのは、RAGが流行っていること自体が、
「AIの内部記憶は真実のソースとして信用しきれない」
という事実を認めている、と言っている点です。

これ、かなり核心を突いていると思います。
もしモデルの中身だけで十分なら、わざわざ外部文書を検索して渡す必要はないはずです。RAGは「AIは賢いけど、知識ベースとしてはそのまま使わない」という、かなり現実的な落とし所なんですね。

ただし、RAGを入れたから幻覚がゼロになるわけではありません。
渡した資料の内容を読み間違えたり、資料にないことを足してしまったりすることはあります。
それでも、**“AIの中だけで完結させない”** という姿勢が大事、という話です。

便利になったのに、むしろ見抜きにくくなっている

ここも印象的でした。
AIの性能は上がっていて、ベンチマーク上の hallucination は減っている。でも現場でのリスクは、そんなに単純には減っていない。なぜか。

理由は、残るエラーほどもっともらしいからです。

昔のAIの誤答は、「いやそれはないでしょ」とすぐわかるものも多かった。
でも最近のモデルは、文章がこなれているぶん、間違いも自然に見える。
つまり、明らかにおかしいエラーは減ったが、見抜きにくいエラーが残る。これはかなり厄介です。

医療、法律、金融のような分野では、この問題はさらに深刻です。
たとえば、

間違った薬の量
存在しない判例
事実と違う財務情報

こういうミスは、ただの誤字脱字とはわけが違います。
しかも、AIの答えが流暢だと、人はうっかり信じやすい。
ここが本当に怖い。個人的には、AIの危険性は「間違うこと」そのものより、間違いが上手すぎることにあると思います。

じゃあ、どう設計すればいいのか

この記事は、単に「AIは危ない」で終わりません。
むしろ重要なのは、幻覚が起きる前提でシステムを作ることだと提案しています。

著者が挙げている考え方を、かみくだいてまとめるとこうです。

1. 生成より先に、検索で根拠を持ってくる

AIの頭の中の知識を信じるのではなく、外部の資料やDBから取ってくる。
そのうえで答えを書かせる。
AIは「知識の保管庫」ではなく、文章を組み立てる補助役として使う。

2. 出典を必須にする

AIが出した主張は、どの文書・どの行・どのツール呼び出しに基づいているか追えるようにする。
追えないなら、断定文として見せない。
これは地味ですが、かなり大事です。

3. それっぽい自信を盛らない

UIでAIの出力を、検証済み情報と同じ重みで見せると危険です。
人間は見た目に弱いので、きれいに表示されるほど信じてしまう。
だからこそ、未検証の情報は未検証だと分かる見せ方が必要です。

4. 最終判断は人間が持つ

特に高リスク領域では、AIに最終決定を任せるべきではない。
AIは下書き、要約、一次整理まで。
最後に読むのは人間。
これは「人間至上主義」だからというより、誤り方が危険すぎるからという工学的な判断です。

この記事のいちばん大事なメッセージ

著者の主張を一言でいうと、
「次のモデルが hallucination を完全に消してくれる」という期待を捨てよう
ということです。

これは少し厳しい見方ですが、かなり現実的でもあります。
なぜなら、言語モデルは「それっぽく返す」ことで機能しているからです。
その性質を保ったまま、完全に幻覚だけを消すのは難しい。
だからこそ、AIを魔法の箱として扱うのではなく、壊れた鏡として扱うほうが健全だ、というわけです。

個人的には、この考え方はAI活用の姿勢をかなり変えると思います。
「AIに正解を出させる」のではなく、
「AIが作る下書きを、人間が安全に使える形に整える」
この発想に切り替えると、現実に使える場面がぐっと増えるはずです。

まとめ

AIの hallucination は、単なる不具合ではなく、言語モデルの設計に根ざした問題です。
だから、完全除去を期待するより、

根拠を外部から持ってくる
出典を残す
断定しすぎない
最後は人間が確認する

という設計のほうが、ずっと筋がいい。

AIは便利です。かなり便利です。
でも、便利さと真実性は別物。
この記事は、その当たり前だけど見落としやすい事実を、鏡の比喩で見事に言語化していると思います。

参考: The cracked mirror: why AI hallucination is structural, not a bug

同じ著者の記事

ブラウン大学で起きた「AIカンニング」騒動、大学の信頼はどう守るのか

ブラウン大学の経済学者ロベルト・セラーノ教授が、担当科目の試験で少なくとも50人がAIを使って不正をしたと訴えている。問題になったのは、持ち帰って解く形式の試験。自宅でじっくり考えられる反面、ChatGPTのようなAIを使いやすい。期末試験では平均点が一気に落ち、欠席者の多くが前回満点だったことから、教授は「証拠は圧倒的」と見ている。ブラウン大学の反応は鈍く、教授は「大学全体で学問の誠実さを守る議論が必要だ」と主張している。背景には、米国の名門大学で広がるAI利用の誘惑と、教育のあり方そのものを揺さぶる問題がある。ブラウン大学で起きたこの話、かなり重いです。しかも、ただの「試験でズルした人がいました」という話では終わりません。大学が長年かけて築いてきた信頼、つまり「ここで学んだ学生の成績には意味がある」という前提そのものが、AIの登場でぐらついている。この記事は、その現場で何が起きているのかをかなり生々しく伝えています。中心にいるのは、ブラウン大学の著名な経済学者ロベルト・セラーノ教授です。彼は、数学的経済学の上級学部生向け講義 ECON 1170 を担当していて、

papoo.work

AIにMRIを読ませたら、医師と真逆の答えが出た話

肩が痛い。だからMRIを撮った。そこまではよくある話です。ところがこのブログ記事は、そこで終わりません。著者はそのMRI画像を、OpenAI系のモデルではなく、Claude Code上で動かしたOpus 4.8に読ませて、「もう一つの診断」を引き出そうとします。で、出てきた答えがかなり衝撃的でした。医師は「腱板の部分断裂（Grade III）」と見たのに、AIは「腱は保たれている」と判断したんです。この差、かなり大きいです。しかも著者は、ただAIに雑に投げたわけではありません。DICOM形式のMRIデータを用意し、Claude Codeに必要なパッケージを入れさせ、かなり本気で解析させています。単なるお遊びではなく、「AIが医療画像をどこまで読めるのか」を自分の体で試した記録、と言ったほうが近いです。肩の痛みでMRIを撮った著者が、AIに画像の再読影をさせた人間の医師は「Grade IIIの部分断裂」と判断した Opus 4.8は最初、「腱は正常」と報告したその後、別の条件で再比較させた結果、AIは「明らかな断裂は見当たらない」と結論づけたただし著者自身は、AIも医師も完全に

papoo.work

AIコーディングは「レビュー」より「テスト」で殴るほうが強い、という話

著者は、AI coding を使っていると「人間なら即クビ」レベルの妙な挙動に何度も遭遇したが、それでも利用をやめるどころか、さらに使い込むようになった。この記事の中心テーマは、AI にコードを書かせるときは code review 以上に test process が大事 だ、という主張。その根拠として、著者は昔働いていた CPU 設計会社 Centaur のテスト文化を紹介する。そこでは、手書きテストより fuzzing や random testing を重視し、unit test はほぼ使わず、専任の test engineer がいた。著者は、AI 時代の開発でも「人間が全部レビューする」より、「大量の自動テストで叩く」ほうが現実的で、しかも強いと考えている。ただし、これは単なる理想論ではなく、実際にバグを見つけて直してきた現場の感覚から来ている。本文を読んでまず面白いのは、著者の出発点がかなり変わっていることです。AI coding を「便利な補助輪」ではなく、かなり攻めた実験装置として見ています。しかも、その最初の印象がすごい。バ

papoo.work

Apple Neural Engineの中身を、かなり踏み込んで覗いた研究

Appleの「Neural Engine」、通称ANEは、iPhoneやMacの中で静かに働く専用チップです。顔認識、写真の補正、音声処理、生成AIの一部まで、裏側でかなり多くの仕事を抱えています。ふだんはCore MLというApple公式の仕組み越しにしか使えないので、一般の開発者から見ると「中はブラックボックス」の代表格でした。今回のarXiv論文は、そのブラックボックスをかなり本気で分解したものです。しかも単なる憶測ではなく、Apple silicon上での直接計測と、private runtime、compiler、kernel driver、firmwareの静的解析を組み合わせている。こういう研究は地味に見えて、実はとても面白いです。Appleが“使わせるつもりのない層”にまで手を伸ばして、仕組みを記述しているわけですから。この論文は、Apple Neural Engineのアーキテクチャ、プログラミング方法、性能の限界をまとめた「リバースエンジニアリングのガイド」です。対象はA11世代のiPhone/iPadチップからA18、そしてM1からM5まで。かなり広い。特に

papoo.work

AMDでもここまで速い。GLM-5.2を“安く速く”動かしたWaferの話

Waferは、GLM-5.2をAMDのMI355X GPU上で動かし、かなり高い性能を出した。しかもポイントは「速い」だけでなく、「Blackwell系より2倍以上安いのに性能効率が高い」こと。ただし、AMDで最先端LLMをそのまま使うのは簡単ではなく、quantizationやinference frameworkの調整がかなり効いている。 speculative decode という高速化手法のために、ROCm向けの小さな修正も必要だった。個人的には、ここで見えるのは「GPUの勝負」だけではなく、「ソフトウェアの面倒をどこまで減らせるか」が勝負になってきた、という現実だと思う。 Waferの記事は、タイトルの通りかなりストレートです。要するに「1ドルあたりの性能、まだ伸ばせるし、しかも安くできる」という話です。対象はGLM-5.2というオープン系の大規模言語モデルで、これをAMD MI355X上でかなりうまく動かした、という内容でした。まず数字が強いです。Waferは、20k input / 1k output、cache hit rate 60% という条件で、1ノードあ

papoo.work

Codexに「見ちゃダメなファイル」を教える仕組みがほしい、という話

GitHubのopenai/codexリポジトリに、ちょっと地味だけどかなり重要な要望が出ています。内容はシンプルで、AIエージェントに読ませたくないファイルを明示的に除外したい、というものです。これ、派手さはないんですが実際にはかなり大事です。AIにコードを書かせる時代になっても、「これは見せていい」「これは絶対にダメ」の線引きは、人間がしっかり持っていないと危ない。そこをちゃんと仕組みにしよう、という提案です。このIssueで求められているのは、エージェントが読み込んだり、モデルに送ったりしてはいけないファイルやパスを明示できる機能です。しかも単なる一時的な指定ではなく、次の2段階を想定しています。リポジトリごとの設定ユーザー全体のグローバル設定たとえば、プロジェクト内に `.codexignore` のようなファイルを置いて「このリポジトリではこのファイル群は触るな」と定義する。一方で、ユーザー側にも「どのプロジェクトでも `.env` や秘密鍵っぽいものは見せない」という共通ルールを持てるようにしたい、という考えです。ここで面白いのは、**“プロジ

papoo.work

文字を画像にしてトークンを節約する、かなり変わったProxy「pxpipe」

Claude CodeのようなLLM向けツールで、長いテキストをそのまま送らず、画像に変換してからモデルに渡す仕組み文字がぎゅっと詰まった内容ほど得をしやすく、場合によってはトークン使用量を大きく削減できるただし万能ではなく、IDやハッシュのような“1文字でも間違えたら困る情報”は危ないだからこそ、安くなる場面と危ない場面を見極める設計になっている発想はかなり攻めているが、実務の痛点をちゃんと突いていて面白い pxpipeは、ひとことで言うと「LLMに渡す長文を、必要に応じて画像に圧縮してしまうローカルProxy」です。Proxyというのは、アプリとAPIのあいだに入って通信を中継する仕組みのこと。ブラウザの世界でいう“中継サーバー”みたいなものだと思えば大きく外れていません。普通、LLMにたくさんの文章を読ませると、そのぶんトークンが増えます。トークンは、AIが文章を扱うときの細かい単位で、課金やコンテキスト長の計算に使われます。つまり、長文を入れるほどお金も容量も食う。これは避けようがない、と思われがちです。でも pxpipe はそこに逆張りをします。大量のテキストをP

papoo.work

GPUの“待ち時間”を消すという発想が、Moondreamでかなり気持ちいい

Moondreamのブログ「Popping the GPU Bubble」は、AI推論を速くする話です。ただし、単に「GPUを強く使えば速くなる」という雑な話ではありません。むしろ逆で、GPUがサボってしまう“すき間時間”をどう消すかに真正面から向き合っています。ここが面白い。 AIの推論では、GPUが大量の計算をして次のトークン（ざっくり言うと、文章のかたまり）を出します。ところが実際には、GPUが計算している時間よりも、CPUが「次は何をやるか」を準備している時間のせいで、GPUが待たされることがあります。これが記事のいう GPU bubble です。風船みたいに膨らんだ無駄な待ち時間、という比喩ですね。 Moondreamはこの待ち時間を、pipelined decoding という方法で減らしています。要するに、「前のトークンの後片付けをCPUがしているあいだに、GPUは次のトークンの計算をもう始める」という並行処理です。これだけ聞くと当たり前に見えますが、実際に安全にやるのがかなり難しい。そこでこの記事では、その工夫をかなり丁寧に説明しています。

papoo.work

vLLMが狙うのは「賢いモデル」より先にあるものだった

vLLM Semantic Router は、1回のモデル呼び出しの裏で複数モデルを協調させる「micro-agent runtime」を目指しているユーザーから見ると API はたった1つでも、裏では confidence / ratings / ReMoM / fusion / workflows などの実行方式を切り替えられる重要なのは「全部を巨大なモデル1発に任せる」ことではなく、仕事の形に合ったループを選ぶことベンチマークでも、単一モデルの置き換えではなく「コラボレーションで性能を作る」発想が効いている個人的には、これはかなり面白い方向だと思う。モデルそのものを巨大化する競争だけでなく、サービング層が頭を使う時代に入ってきた感じがある vLLM の記事「Micro-Agent: Beat Frontier Models with Collaboration inside Model API」は、ひとことで言うと「モデルを返すだけのサーバー」から「モデルの力を組み立てるサーバー」へ、という話だ。普通、APIで `model` を指定したら、そのモデルが1回答えて終わり

papoo.work

データベースを「1台の箱」から解き放つ発想が面白い

Databricksのこの記事は、Postgresを土台にしたサーバーレスDB「Lakebase」と、その先にある「LTAP」という考え方を紹介しています。話がかなり技術寄りなので、最初は「何のことだ？」となるかもしれません。でも中身はわりとシンプルで、ひと言でいえばデータベースの“保存のしかた”を根っこから見直そうという話です。いま多くのデータベースは、書き込みログも実データも、だいたい1台のマシンの中で抱え込んでいます。この記事はそこを「そもそも古くないか？」と疑い、クラウド時代に合う形へ組み替えています。ここがかなり面白い。しかも単なる理想論ではなく、書き込みの安全性、読み取りの拡張、障害対策、分析処理との干渉まで一気に整理しているのがポイントです。伝統的なデータベースは、WAL（書き込みログ）と data files（実データ）を1台のマシンに持つ「monolith」になりがちその構造だと、データ消失のリスク、read replica の高コスト化、分析処理による遅延が起きやすい Lakebase は Postgres の compute を stat

papoo.work