世界の技術ニュースをリアルタイムでキャッチし、日本語でわかりやすく発信。AI・半導体・スタートアップから規制動向まで、グローバルテックシーンの「今」をお届けします。

2026-05-20

AI×セキュリティツールはなぜ「それっぽい嘘」をつくのか──OSINTをターミナルで回す新しい設計の話

記事のキーポイント

AIをセキュリティ調査にそのまま使うと、本物っぽい誤情報を平気で出すことがある
失敗の原因は、LLMが「もっともらしい答え」を作るのが得意すぎること
ふつうの ReAct ループでは、モデルがツール結果を予測してしまい、後から現実に合わせにくい
Anthropic の native tool use API では、ツール呼び出しと結果の受け渡しを構造化でき、幻覚をかなり抑えられる
著者はこれを使って、ターミナルから OSINT 調査を回すオープンソースエージェント OpenOSINT を作った
「全部自動化」よりも、状況に応じて次の調査を選べるエージェントのほうが実用的、という主張が面白い

「AI+セキュリティ」は便利そうなのに、なぜ危ないのか

この記事の出発点はかなり衝撃的です。著者が以前使った AI の OSINT（Open Source Intelligence）ツールは、調査結果としてこんなものを出したそうです。

Twitter: @targethandle
GitHub: https://github.com/megadose/holehe
IP Address: 80.249.165.118
SSH Banner: SSH-2.0-OpenSSH_7.6p1 Ubuntu-4ubuntu0.3
Organization: Unnamed Organization (United States)

でも、全部ウソだった。
対象の Twitter ハンドルではないし、GitHub の URL はリポジトリそのもの、IP も SSH バナーも組織名も捏造。しかも、見た目がきれいだから余計にたちが悪い。

ここがこの記事の核心です。
LLM（大規模言語モデル、要するに ChatGPT のような「文章を作るのが上手いAI」）は、自然な文章や、いかにもありそうなフォーマットを作るのが得意です。ところが OSINT やセキュリティの世界では、「それっぽい」ではダメで、実在する情報だけが必要です。

私はここ、かなり重要だと思いました。
AI の失敗って、単に「知らない」と言ってくれればまだマシなんです。でも、セキュリティでは“見た目だけ正しい誤情報”が一番危ない。人間はつい信じてしまうからです。

なぜ普通の ReAct ループではうまくいかないのか

著者は最初、よくある ReAct loop を試します。
ReAct は Reasoning + Acting の略で、ざっくり言うと「AIに考えさせ、必要ならツールを呼ばせ、結果を見て次を考えさせる」方式です。

イメージとしてはこんな感じです。

モデルが「このツールを使いたい」と JSON っぽく返す
プログラムがそのツールを実行する
結果をモデルに返す
さらに次の判断をさせる

一見すると正しそうですが、問題はモデルがツール結果を“予測”してしまうこと。
つまり、ツールを呼ぶ前から「たぶんこんな結果だろう」と勝手に物語を作ってしまい、実際の結果が返ってきても、その物語に引っ張られてしまうんです。

著者は次のような指示も試したそうですが、うまくいかなかったとのこと。

「絶対に結果を捏造するな」
「ツール出力をそのままコピーしろ」
「データがなければ No results found と言え」

それでもモデルは、要約したり、文脈を足したり、挙げ句の果てに存在しない結果まで並べたりした。
つまり、AIが「OSINT analyst を演じている」状態であって、実際に調査しているわけではなかった、というわけです。

これ、AIアプリ全般に通じる話だと思います。
「会話として自然」なことと、「道具として正確」なことは、かなり違うんですよね。

解決策は native tool use API だった

著者がたどり着いた答えは、Anthropic の native tool use API です。
これは、モデルに「ツールを使いたい」とテキストで言わせるのではなく、構造化された tool call として扱う仕組みです。

ポイントはここです。

モデルが stop_reason: "tool_use" で止まる
その時点でプログラムが本物のツールを実行する
結果は tool_result としてモデルへ返す
モデルはその実データを見て続ける

つまり、モデルが勝手に「こういう結果が返るはず」と作文する余地を減らしているんですね。
著者はこれを「幻覚（hallucination）が構造的に起きにくい」と表現しています。

この設計、かなり賢いと思います。
AIに“頭の中でそれっぽくやらせる”のではなく、システム側で現実を強制的に差し込む。セキュリティ用途では、こういう強い制約のほうが向いています。

OpenOSINT という仕組み

この考え方を実装したのが、著者の OpenOSINT です。
ターミナルから OSINT 調査を実行できる、オープンソースの AI エージェントです。

構成は大きく 3 層に分かれています。

1. Provider layer

LLM の種類を抽象化する層です。
Anthropic、OpenAI、Ollama などを同じインターフェースで扱えるようにしています。

つまり、裏側のモデルを変えても、アプリの他の部分はあまり触らなくていい。これは地味ですがかなり便利です。

2. Tool registry

OSINT 用のツールを登録する層です。
@register_tool のような decorator（関数に付ける印のようなもの）で、ツールを追加できます。

例としては、メールアドレスから関連アカウントを探す search_email があり、内部では holehe を使っています。
holehe は、メールアドレスがどんなサービスで使われていそうかを調べるツールです。

3. Agent loop

実際に「モデルが考える → ツールを呼ぶ → 結果を見る」を回すループです。
ここで先ほどの native tool use API を使います。

著者の設計思想はかなり明快で、新しいツールを追加するにはファイル1つと decorator 1つで済むようにしているそうです。
こういう「増やしやすさ」は、実際の運用でかなり効きます。

どんなツールがあるのか

OpenOSINT には、次のようなツールが含まれています。

search_email — メールに紐づくSNSアカウントを探す
search_username — ユーザー名で 300以上のプラットフォームを調べる
search_domain — サブドメイン列挙
search_breach — データ漏洩に含まれているか確認
search_whois — ドメインの登録者情報を調べる
search_ip — IP の位置情報や ASN などを調べる
generate_dorks — Google dork 用の検索URLを作る
search_paste — Pastebin 系の流出情報を探す
search_phone — 電話番号のキャリアや国などを調べる

専門用語を少しかみ砕くと、

WHOIS: ドメインの持ち主情報を見る仕組み
dork: 検索エンジンで特定の情報を狙って探すための検索式
breach: 情報漏洩
ASN: インターネット回線の組織単位みたいなもの

こうして見ると、AIが何でもやるというより、既存の調査ツールをうまく束ねる司令塔として働いているのがわかります。

固定パイプラインより、エージェントのほうが強い理由

ここ、記事の中でも特に納得感がありました。

単純な方法としては、毎回決まった順番でツールを回すやり方があります。
たとえば、

まず holehe
次に sherlock
次に HaveIBeenPwned

みたいに固定するやり方です。
これはシンプルで再現性もありますが、問題は対象によって必要な調査が違うこと。

たとえば、

メールアドレスがあるなら → holehe と漏洩確認が有効
ドメインがあるなら → WHOIS とサブドメイン調査が有効
名前しかないなら → まず dork で手がかりを探すべき

という具合です。

特に面白いのは、著者がこんな流れを挙げているところです。
名前しかない人に対して、いきなり search_username("John Doe") を回してもあまり意味がない。むしろ generate_dorks で検索し、そこから @johndoe_dev のような実際のハンドルを見つけ、その後に search_username("johndoe_dev") を実行する。
この順番の判断を、エージェントが自分でできるわけです。