GPTZeroが公開したのは、EY Canadaのレポートに含まれる**“hallucinations”、つまりAIっぽい生成ミスの調査です。
ここでいう hallucination は、AIが本当は存在しない情報を、もっともらしく作ってしまう現象**のこと。人間が見てもそれっぽく見えるのがたちが悪いんですよね。

調査対象になったのは、2025年に公開されたサイバーセキュリティ報告書
“Points of Attack: Uncovering Cyber Threats and Fraud in Loyalty Systems”。
ロイヤルティ・プログラム、つまりポイントや会員特典の仕組みを狙った不正を扱うレポートです。
GPTZeroによると、このレポートは

といった問題を大量に抱えていたそうです。
率直に言うと、Big Fourの一角であるEYのような大きな組織でもこれが起きるのか、というのはかなりショックです。
もちろん、個別のミスはどの組織にもあります。ただ、ここまで引用の品質が崩れていると、単なる凡ミスではなく、AIをかなり雑に使ったのではないかと疑いたくなります。

記事の中心にあるのが、この vibe citing という言葉です。
GPTZeroのエンジニアが作った表現で、ざっくり言えば「引用っぽいものを、AIの勢いでそれらしく作ってしまうこと」です。
たとえばAIにレポートを書かせると、

を、かなり自然に出してきます。
でも実際にはその文献が存在しなかったり、リンク先が404だったりする。これが怖い。
しかも厄介なのは、引用を付ける作業って人間にとって面倒なので、チェックを省きたくなる誘惑が強いことです。
GPTZeroは、そこに「AIが作った引用をそのまま信じる」流れが入り込んでいる、と見ています。これはかなり説得力のある指摘だと思います。

GPTZeroは、レポート中の参考文献を一つずつ追跡しました。
すると、27件の参照のうち多くが幻の文献だったとしています。
たとえば、

といった具合です。
ここで面白いのは、単に「リンクが切れている」だけではない点です。
タイトルそのものが存在しないケースがある。つまり、URLの修正で済む話ではなく、出典をそもそも作ってしまった可能性があるわけです。

たとえば、ロイヤルティポイント市場について
のように、同じ数字が別の意味で使われています。

さらに、未使用率が30〜50%なら、全体市場はもっと大きくないと辻褄が合わない。
こういう矛盾は、AIが文章を“それっぽく”つないだ結果、論理整合性が崩れたときによく見られるパターンです。
個人的には、この手のズレはかなり重要だと思います。
なぜなら、読者は「数字がある」と安心してしまうからです。実際には、数字があることと数字が正しいことは、まったく別問題なんですよね。

GPTZeroは、EYのレポートの一部が、あまり信用できない別のブログ記事に近いと指摘しています。
そのブログ記事には、存在しないMcKinsey報告書への引用が載っていたらしく、EYのレポートはそれをほぼそのまま取り込んでいるように見える、としています。
これはかなり嫌な話です。
低品質な記事に入っていた“偽の引用”が、大手コンサルの報告書に移植されると、見た目の権威だけが増幅されるからです。
つまり、誤情報が「大企業のお墨付き」を得たように見えてしまう。これは普通に危ない。

GPTZeroが強調しているのは、こうした誤情報は単に読者をだますだけではない、という点です。
レポートが公開されると、それ自体がインターネット上の知識の材料になります。検索エンジン、AI検索、調査メモ、ニュース記事、社内資料など、いろいろな場所で再利用されるからです。
つまり、間違ったレポートが、次の人の調査の“入口”になってしまう。
これが本当にやっかいです。GPTZeroはこれを「poison the well(井戸に毒を入れる)」にたとえていますが、かなり的確な表現だと思います。
しかも最近は、ChatGPTやClaude、Perplexityのような deep research 系のツールが増えています。
こうしたツールは、人間とは違う基準で情報源を拾うので、一度ネット上に乗った偽情報をさらに拾いやすい。
AIがAIのミスを増幅する構図は、かなり現代的な問題です。

この件で印象的なのは、問題が「派手な捏造」ではなく、地味な粗さの積み重ねとして現れていることです。

こういう“なんとなく”が積み重なると、見た目は立派でも中身が空っぽな文書になります。
そしてそれが、Big Fourのレポートという肩書きを背負って世に出る。うーん、これはかなり現代的な事故だと思います。
ただし、ここで大事なのは「AIはダメだ」で終わらせないことです。
本当の問題は、AIを使うこと自体より、AIの出力を検証せずに流通させる運用にあるはずです。
AIは下書きには便利です。でも、引用と事実確認をサボると、一気に信頼を失います。

GPTZeroは、この調査を通じて「vibe citing は、研究者・コンサル・法律家・公務員にとって明確な脅威だ」と主張しています。
そして、自社の Hallucination Check ツールで、引用や参照の幻覚を見つけられるとアピールしています。
さらに、同社はこのツールがすでに学術会議の提出物チェックにも使われていると述べています。
ここは商売っ気もありますが、同時に問題意識としては筋が通っています。
要するに、**“引用は信用してはいけない。少なくとも、そのまま信じるな”**というメッセージです。
この主張、ちょっと大げさに聞こえるかもしれません。
でも今回のような事例を見ると、あながち言い過ぎとも思えないのが怖いところです。

この調査が教えてくれるのは、AI時代の文書で本当に怖いのは、文章の滑らかさではなく裏取りのなさだということです。
EYのレポートは、見た目は専門的でも、引用や統計の信頼性に大きな疑義があるとGPTZeroは指摘しました。
そして、そのような資料が一度公開されると、検索結果やAI回答、ニュース記事にまで波及していく。
これは、単なる一社の失敗ではなく、情報流通全体の問題として見るべきだと思います。

個人的には、今後は「文章がうまいか」よりも「出典が追えるか」「数字が整合しているか」をもっと重視する空気が必要ではないか、と思います。
AIが文章を量産できる時代だからこそ、引用の検証能力が、人間側の重要なスキルになっていくはずです。
参考: Investigation: Hallucinations in Ernst & Young Report on Loyalty Fraud | GPTZero