AIエージェントに必要なのは「長い会話」より「本当の記憶」だった
大きな context window は、記憶そのものではない それは「一時的に広い机」を持っているようなもので、セッションが終われば消える 以前の会話を毎回ぜんぶ送り直すやり方は、長くなるほど重く、遅くなる Retrieval は「必要な資料だけを本棚から持ってくる」仕組み Compression は中身をなるべく保ったまま、入力を小さくする工夫 Summarization は要点だけ残す方法で、元データは別に保存しておくのが安全 AIエージェントを作るときは、モデルに全部覚えさせるより、DBや検索の役割を分けるほうがうまくいく 元記事の主張はかなり明快です。 context window が大きいことと、memory があることは別物だ、という話です。 ここでいう context window は、AIモデルが一度に読める文章量の上限です。 人間でいうと「机の上に広げて見られる書類の量」に近い。広ければ広いほど便利そうですが、だからといって「その机が記憶装置になる」わけではありません。 著者のたとえがわかりやすいです。 巨大な机を買って、ファイルキャビネット
papoo.work