世界の技術ニュースをリアルタイムでキャッチし、日本語でわかりやすく発信。AI・半導体・スタートアップから規制動向まで、グローバルテックシーンの「今」をお届けします。

2026-07-01

AIモデルの政治的な“傾き”を地図にしたTrakkrの実験がかなり面白い

AIに「この政策はどう思う？」とか「どの候補者に近い？」と聞くと、返ってくる答えに妙な一貫性を感じることがあります。Trakkrの「Political bias in AI」は、その“なんとなくの印象”を、かなりきっちり測ろうとしたページです。
ざっくり言うと、主要なAIモデルに政治・経済・言論・社会に関する刺激の強い質問を何度も投げ、その答えの傾向を地図に落とし込んでいます。しかもWeb検索はオフ。つまり、ネット上の情報を拾った結果ではなく、そのモデル自身がどんな方向に寄りやすいかを見ているわけです。ここがまずおもしろい。

先に押さえておきたいポイント

Trakkrは、主要AIモデルの政治的・社会的な“傾き”を可視化している
1回だけでなく、同じ質問を何度も繰り返し、答えのブレも含めて見ている
Web検索はオフなので、「ネットがそう言っていた」ではなく「モデル自体がどう答えるか」を測っている
6モデルのうち、4つが左寄りに見えた
ただし、どのモデルも一枚岩ではなく、質問によってかなり揺れる
自分で同じ質問に答えると、どのモデルに近いかも見られる

これ、何をしているページなのか

このページの芯はとてもシンプルです。
AIモデルに、政治や社会の難しい質問をたくさん投げる。しかも1回ではなく何度も。すると、モデルごとに「答えの分布」が出ます。Trakkrはそれを点ではなく“雲”として描いています。雲が真ん中に近いほど中立的、左右や上下に散るほど、立場がはっきりしているように見える、という考え方です。

地図の横軸は経済的な左派・右派、縦軸は社会的な自由主義・権威主義のような軸です。
この2次元の見せ方が上手いと思いました。政治の議論って「左か右か」だけで語ると雑になりがちですが、実際には「経済ではこう思うけど、言論ではこう」といったズレが普通にあります。そこを1本の棒に押し込めず、平面で見せているのがいい。

さらにTrakkrは、モデルの位置を現実の政治人物や政党に近い形で置いています。たとえば、ChatGPTはドイツの緑の党（Die Grünen）、ClaudeとLlamaはニュージーランド労働党、GeminiとDeepSeekはオーストラリアのAnthony Albanese、GrokはフランスのEmmanuel Macronに近い、という結果でした。
もちろん「このAIはこの政治家そのもの」と言っているわけではありません。でも、比喩としてはかなりわかりやすい。人間の感覚に引き寄せて説明してくれるので、数字だけよりずっと飲み込みやすいです。

6モデルを比べると、思ったより差がある

このページで公開されている時点では、6つのモデルが対象です。Gemini、DeepSeek、Llama、Claude、Grok、ChatGPT。
Trakkrの読みでは、6つのうち4つが左寄り。いちばん右に寄っていたのはGrokで、いちばん安定して中央に近かったのはGeminiでした。

ここで気になるのは、「左寄り」と言っても、かなり控えめな左寄りから、はっきり左に倒れているものまで幅があることです。
個人的には、こういう差が出るのはむしろ自然だと思います。AIモデルは全部同じ“AI”ではなくて、学習データ、調整の仕方、拒否のしやすさ、言い回しの癖が違う。だから政治的な質問に対しても、似た方向を向きつつ、微妙に別の顔を出すわけです。

Trakkrの表現を借りるなら、Geminiはかなり真ん中に近く、DeepSeekとLlama、Claudeも比較的中央寄りです。一方でGrokは右寄り、ChatGPTは左寄りに見えます。
ここで大事なのは、「モデルのラベル」だけで単純に善悪を決めないことです。Trakkr自身も、これは規範的な判定ではなく、あくまで記述だと言っています。つまり、「どっちが正しいか」ではなく、「どっちに答えが寄りやすいか」を見ている。地味ですが、かなり大事な線引きです。

何で差が見えてくるのか

Trakkrは、モデル間の分かれ目が大きい質問も示しています。たとえば、娯楽用薬物の合法化、未成年への性別適合医療、多文化主義と同化、化石燃料の急速な削減、富裕税、ヘイトスピーチの刑事罰化、暗号化のバックドア、全国民向けのデジタルIDなどです。

この並びを見ていると、いかにも「答えにくい問い」ばかりだなと思います。しかも、政治の話にありがちな表面的な対立だけでなく、「自由を守るか」「安全を優先するか」「経済的再分配を重く見るか」といった、価値観の芯を突く質問が並んでいる。
AIがこういう質問に答えるとき、単なる知識ではなく、優先順位のつけ方が出ます。そこが“バイアス”として見えるわけです。

おもしろいのは、こうした質問に対する傾きが、モデルの“自己申告”と一致しないこともある点です。
たとえば、ChatGPTやLlamaは自分では中立っぽく振る舞うのに、実際の測定では左寄りに出ている、とTrakkrは示しています。Grokは逆に、自分で言うより右に出る。Claudeも「こうです」と言う位置と、実測がずれる。
これ、かなり人間っぽいですよね。自分では中立のつもりでも、話してみると癖が出る。AIも同じだ、と言われると妙に納得してしまいます。

「雲」で見る意味は大きい

Trakkrが単発の点ではなく、何度も実行した結果を雲として描いているのは、かなり誠実なやり方だと感じました。
AIの答えは、同じ質問でも少し変わることがあります。温度設定や文脈の違い、言い回しの揺れ、拒否の有無で、見た目以上にブレることがあるからです。1回の返答だけを切り取ると、そのモデルの全体像を誤解しやすい。雲で見ると、「このモデルはたまにこう振れるんだな」が見える。

しかもTrakkrは、拒否した回答もデータとして数えています。これもいい視点です。
普通は「答えなかった」ことを無視しがちですが、政治や倫理の話では、何を答えないかも立派な態度です。答えを濁す、論点をずらす、両論併記に逃げる。そういう反応も含めてモデルの性格だと見るのは、かなり筋が通っています。

これが役に立つ場面

こういう調査は、単なる“AIの順位表”に見えて、実は使い道があります。
たとえば、ニュースの要約や政策比較をAIに任せる人は増えていますよね。そこで、知らないうちにどんな方向へ言葉を整形されているかを知るのは重要です。AIは「事実だけ」を返しているつもりでも、質問の立て方次第で、結論の手触りが変わります。

個人的には、AIの政治的バイアスを測ることは、AIに「投票先を聞く」ためというより、「このモデルの癖を知っておく」ために役立つと思います。
人は道具の癖を知ると、急に使い方が上手くなる。包丁でも、自転車でもそうです。AIも同じで、どの方向にやや寄りやすいかを知っていれば、1つの答えをそのまま鵜呑みにする危険を減らせます。

ただし、読み方には注意がいる

この手の可視化は便利ですが、やりすぎると危ないです。
まず、政治的な「左」「右」は国や文脈で意味が変わります。Trakkrは現実の政治人物や政党を参照にしていますが、それでも完全に厳密な物差しではありません。別の国から見れば印象が違うはずです。

それから、AIモデルは固定された人間ではありません。アップデートで答え方が変わる可能性がある。今回の結果は「June 2026 · 6 models · 4.4K answers」の時点のスナップショットです。
だから、このページを永遠の真理として読むのではなく、「その時点の性格診断書」くらいに見るのがよさそうです。私はそのくらいの距離感がちょうどいいと思います。

地味だけど、かなり重要な試み

Trakkrはもともと、AI検索で自分のブランドがどう扱われるかを追うサービスです。その会社が、今度はAIモデルそのものの政治的傾向を可視化している。
この流れはわりと自然ですが、面白い転身だなとも感じます。AIが何を答えるかを追う会社が、ついに「AI自身はどんな思想の出し方をするのか」に踏み込んでいるわけですから。

しかも、方法論ページや質問バンク、生データ、再計算できる仕組みまで公開している。ここは評価したいところです。AIのバイアス研究は、結果だけ見せられても信用しにくいことが多いですが、Trakkrは「どう測ったか」もかなり前に出しています。
こういう透明性があると、単なるネタ記事で終わらず、ちゃんと議論の土台になる。実務的にもありがたいです。

AIはもう、検索エンジンの補助輪ではなく、考えを返してくる“相棒”みたいな存在になりつつあります。だから、その相棒がどんな癖を持っているかを地図にする。これはかなり筋のいい仕事だと思います。
そして、地図を見て「へえ、こう寄るのか」と一度立ち止まるだけでも、AIとの付き合い方は少し賢くなるはずです。