世界の技術ニュースをリアルタイムでキャッチし、日本語でわかりやすく発信。AI・半導体・スタートアップから規制動向まで、グローバルテックシーンの「今」をお届けします。

AIに「全部のリポジトリ」を読ませるな。見るべき文脈だけ渡すのが大事、という話

AIにコードを書かせるとき、つい「全部読めば賢くなるはず」と思いがちです。
でも元記事が言うのは、失敗の原因は“コードを書けないこと”ではなく、“間違った文脈を読んでしまうこと”にある、というかなり本質的な指摘です。これ、地味ですがかなり重要だと思います。

キーポイント

AIの失敗は、能力不足より「見るべき情報を間違えること」で起きやすい
情報は多ければいいわけではなく、必要なものだけに絞るほうがむしろ良い
「どれが正しい情報か」を示すsource of truth（正本）を明確にする必要がある
AIにはリポジトリ全体を勝手に探させるより、タスク用の context package を渡すほうが安全
1つの例を「一般ルール」にしてしまうAIの癖を、文脈設計で防げる

この記事が言っていることをざっくり言うと

この記事の主張はシンプルです。

AIに「リポジトリ全部を読んで」と渡すのは、親切そうに見えて実は危ない。
代わりに、その作業に必要な情報だけをまとめた「context package」を渡したほうがよい。

ここでいう context は「状況」や「前提情報」のことです。
AIは文章やコードを読めますが、どれが古くて、どれが正しくて、どれが例外なのか は自動で完璧に判断できません。そこを人間が設計してあげる必要がある、という話ですね。

「情報が多いほど良い」は、AIではむしろ危ない

人間でも、資料が多すぎる会議って混乱しますよね。
「READMEにはこう書いてあるのに、古い設計メモには別のことが書いてある」「昔のチャットログに、もう捨てた案が残っている」みたいなことは普通に起きます。

AIも同じで、いや、むしろAIのほうがその影響を受けやすいです。
元記事では、AIが次のようなものを正しいものとして拾ってしまう危険を挙げています。

古い documentation
すでに無効な roadmap
単なるメモなのに製品ルールだと誤解する情報
失敗した1つのサンプルからの過剰な一般化
似た名前の、でももう古い実装

このへん、すごくあるあるです。
個人的には、AIの失敗って「頭が悪い」というより、**“情報の棚卸しが下手”** なんだと思います。だから、棚を整理して渡すほうが効くわけです。

大事なのは「全部」ではなく「正しい範囲」

元記事が強調しているのは、narrow context という考え方です。
これは「狭い文脈」と訳せますが、要するに

タスクに必要な事実だけ入れる
関係ないものは見せない
迷わせる情報を最初から排除する

という設計です。

ここで面白いのは、コンテキストは広ければ広いほど良い、という直感を否定している点です。
大きなAIほどたくさん入れたくなりますが、実務では「余計な情報で混乱する」ほうが痛い。これは人間の仕事でも同じですが、AIではさらに露骨に出る気がします。

「source of truth」を明示するのが超重要

この記事の核の1つがここです。
source of truth は「正本」「最終的に信頼する情報源」のことです。

たとえばコードベースなら、

今動いているコード
テスト

が、古いドキュメントより優先されることが多いです。

一方で、製品の説明なら、

README
user docs
release artifacts
実際に動く demo

のほうが、昔の企画書より信頼できます。

つまり、情報には優先順位があるんですね。
これ、当たり前のようでいて、AIに渡すときはすごく大事です。AIは「置いてあるものを全部同じ重みで見てしまう」ことがあるので、こちらが

何を正とするか
何を補助資料とするか
何を古いものとして扱うか

を明示しないと危ないわけです。

元記事の言い方を借りるなら、**“available materials are equally reliable” だとAIが誤解する**。
これはかなり本質的で、しかも地味に怖いポイントです。

context package には何を入れるのか

元記事では、context package は難しいものではなく、かなり実用的に作れると言っています。入れるべきものの例はこんな感じです。

タスクに関係する project rules
source-of-truth files
関連する specs、ADR、issue、PR、runbook
関連する tests、fixtures、screenshots、traces
既知の失敗パターン
検証コマンド
変更してよいファイル
変更してはいけないファイル
もし矛盾したらどれを優先するかのルール

ADR は Architecture Decision Record の略で、設計判断を記録した文書です。
runbook は、トラブル対応や運用手順を書いたメモですね。

要するに、AIに「考えさせる」前に、迷わない材料をセットで渡す ということです。
これって、かなり人間っぽい仕事のさせ方なんですよね。新人に雑に「全部読んでおいて」ではなく、「まずこの資料だけ見て、このルールに従ってね」と渡すのに近いです。

「プロジェクトごとの事情」は、汎用AIでは分からない

ここも重要です。
元記事は、一般的な agent tools が強くても、そのプロジェクトの“真実の階層”までは最初から知らないと言っています。

例えば記事内では、具体例として次のようなプロジェクトを挙げています。

TidalFi worker: お金、trading、KYC、production release に関わるパスを知る必要がある
SketchUp Agent Harness worker: design model、source evidence、SketchUp scene の関係を知る必要がある
knowledge publication worker: knowledge base が bilingual candidates を持ち、site が rendering と deployment を担う、という役割分担を知る必要がある

要するに、「このプロジェクトでは何が重要か」は、一般論では決まらないということです。
これは完全にその通りだと思います。現場のルールって、リポジトリの外にあることが多いんですよね。
READMEに全部は書いてないし、書けない。だからこそ、AI用に文脈を加工して渡す必要があるわけです。

AIは1つの例を「世界のルール」にしがち

記事の後半で面白いのが、overgeneralization への警戒です。
これは「1つの例を見て、そこから勝手に普遍ルールを作ってしまうこと」です。

AIはこれをやりやすいです。
たとえば、

1つの floor plan 修正を見て「設計ツールではこう直すのが正しい」と広げる
1つの trading system の修正を見て、業務ロジック全体を変えた気になる
あるプロジェクトのディレクトリ構成を、全部のプロジェクトに適用してしまう

みたいなことです。

これを防ぐために、元記事では材料にラベルを付けることを提案しています。

fact（事実）
evidence（証拠）
inference（推論）
project-local rule（そのプロジェクトだけのルール）
reusable method（再利用できる方法）
source-specific interpretation that must not be generalized（一般化してはいけない、特定ソース依存の解釈）

この分類、かなりいいです。
個人的には、AIに渡す情報って「内容」だけじゃなくて「身分証明」が必要なんだな、と思いました。
これは事実？それとも例外？それともこのプロジェクトだけの都合？
そのラベルがないと、AIは平気な顔で全部を“法則”にしてしまう。