世界の技術ニュースをリアルタイムでキャッチし、日本語でわかりやすく発信。AI・半導体・スタートアップから規制動向まで、グローバルテックシーンの「今」をお届けします。

2026-07-04

AIセキュリティの“請求書”が先に来る時代

SecurityWeekの記事が面白いのは、AIそのものの性能ではなく、「使ったぶんだけ請求が膨らむ」という現実を、サイバーセキュリティの文脈でかなり生々しく描いているところです。
AIは便利です。そこはもう疑いようがない。でも、守る側の現場では、その便利さがそのままコスト爆弾にもなりうる。この記事は、その嫌なけれど大事な話を正面から扱っています。

まず押さえておきたいポイント

セキュリティ製品がAI、特に agentic AI を組み込むと、性能だけでなく token 消費コストが効いてくる
Machine Learning、GenAI、Agentic AI では、動き方もコスト構造もかなり違う
token は「AIが読む・書く文字量」に近い課金単位で、使うほど請求が増える
重大インシデントでは、1件の調査で数万〜数百万 token が飛ぶことがある
コスト上限にぶつかると、調査の打ち切りや機能制限が起きてしまう
Cloud 型は変動費が重くなりやすく、On-premises のほうが経済性を読みやすい場面がある

この記事が刺さるのは、AIの議論が「便利」「賢い」で止まりがちなところに、ちゃんと財布の話を持ち込んでいるからです。しかもこれ、かなり現実的です。セキュリティの世界は、ひとたび何か起きると一気に大量のログを読み、相関を取り、次の調査を回す必要があります。AIがそこを肩代わりするのは理にかなっている。でも、その分だけ回転数が上がり、請求も回る。ここが厄介なんですよね。

記事の冒頭には、少し皮肉の効いたシーンが置かれています。深夜のSOCアナリストが重大アラートに向き合い、AIエージェントを使って認証履歴をたどり、内部ログを照合し、脅威情報を引き、横展開の痕跡を探す。調査は機械の速度で進む。ところが画面に出るのは「今月のAI上限に達しました。続けるには Enterprise Plus にアップグレードしてください」というメッセージ。
これ、笑い話の形をしているけれど、言っていることはかなり怖いです。攻撃者は待ってくれないのに、防御側は“今月分のAIを使い切ったので続きは明日”になりかねない、という話ですから。

記事では、AIを3層に分けて整理しています。これはわかりやすいです。

まず Machine Learning。これは従来型の統計的な手法で、正常/異常のパターンを数値で扱います。言語を読んで長々と推論するわけではないので、token は使いません。コストはCPUやGPUの計算量で見ます。要するに、昔からある「重いけど、見積もりはしやすい」世界です。

次に GenAI。これは人が問いを投げて、AIが要約や説明を返すタイプです。人間がプロンプトを打つ分だけ処理が発生するので、token 消費はまだ比較的読みやすい。セキュリティ運用で言えば、「このアラート、何が起きたの？」と聞いて整理してもらう用途ですね。

そして Agentic AI。ここが本題です。これは人の細かい指示を待たず、ある目的だけ渡すと、AI自身が API を呼び、ログを読みに行き、次の調査を計画し、また動く。つまり、自動で調査ループを回します。便利さは抜群ですが、同時に「止めどころ」がなくなる。人間が“ここまで”と区切っていたものが消えるので、meter が回り続けるわけです。

記事が強調しているのは、token 課金の性格です。token はざっくり言えば、AIが読む・書く文字の単位です。人間の感覚だと「文字数課金」に近いイメージで、入力にも出力にもお金がかかる。SecurityWeek の記事では、Anthropic の Claude Sonnet 4.6 が入力100万 token あたり3ドル、出力100万 token あたり15ドル、GPT-5.5 が入力5ドル、出力30ドルと紹介しています。
金額だけ見ると「意外と安いのでは」と思うかもしれません。でも、セキュリティは1回の会話で終わる仕事ではありません。1件のインシデントで、何万、何十万、時には何百万 token が消える。ここが普通の業務AIと全然違うところです。

記事の数字感覚はかなり印象的です。
単純なアラートの仕分けなら1,000 token くらいで済むかもしれない。けれど、調査をAIに任せて、イベントの流れを追わせ、関連テレメトリを引かせると2万〜5万 token くらいになる。さらに agentic loop が深くなると、ログを大量に読んで、複雑なAPIを叩いて、結果をまたモデルに戻して……という動きになり、1件で数百万 token に達することもある。
しかもそれが、1日に大量のアラートに対して並列に走るわけです。そりゃ請求は跳ねます。率直に言って、AIの夢の部分より先に、経理の悲鳴が聞こえてきそうです。

記事では実例も挙げています。ある会社は employee license の利用制限を設定し忘れて、Claude の請求が月5億ドルに達した。Uber の CTO は2026年分のAI予算を4月に使い切った。Palo Alto Networks が Anthropic の Claude Mythos を自社コードに試した際は、2ダース以上の重大脆弱性を見つけた一方で、token だけで100万ドル超を使った。
このあたりは、AIの価値とコストが同時に暴れている感じがあって、かなり象徴的です。性能が出るほど費用も燃える。実に現代的で、少し嫌な美しさがあります。

この記事の核心は、セキュリティ運用にとって何がまずいのか、です。私はここが一番重要だと思いました。

ひとつは予算の読めなさです。これまでCISOは、比較的予測しやすいライセンス体系で予算を組んできました。ところが token 課金は変動費です。大規模マルウェア感染や、長引く insider threat の調査が重なると、四半期予算が週末だけで吹き飛ぶこともありうる。しかも“最大いくらまで”の上限が見えにくい。これは経営にとって、かなり扱いにくいです。

もうひとつは、運用上の妥協を強いられることです。昔、SIEM はデータを多く入れるほど高くつくので、組織がログ収集を絞ってしまい、見えない穴が増えました。AIでも同じことが起きる、と記事は警告しています。途中で上限に達したら、追加料金を払うか、調査を止めるか、手作業に戻るかしかない。現場はたぶん、重要度の低いアラートでは agentic workflow を切るようになります。すると、「自動化したはずなのに、肝心なところで弱くなる」という本末転倒が起きる。かなりありそうです。

さらに、配備アーキテクチャの見直しも避けられないと記事は言います。Cloud 型は便利ですが、AIコストの変動をそのまま受けやすい。毎回の reasoning loop、毎回の API call にお金が乗る。一方で On-premises は、ローカルの固定計算資源を使うので、token meter に怯えずに深い推論を回せる。
もちろん On-premises は運用も投資も重いので、何でもかんでも正解ではありません。ただ、agentic AI を本気で常時回したいなら、経済的に成立しやすいのは On-premises だ、という主張は筋が通っています。ここは単なる「クラウドかオンプレか」の話ではなく、AI を安全運用するための設計の話ですね。

記事の終盤で大事なのは、AIコストが見えづらい形で現れるだろう、という指摘です。現実には「月の上限に達しました」とは表示されず、API timeout で調査が止まる、安いモデルに自動で切り替わって精度が落ちる、低優先度のワークフローだけ止まる、といった静かな劣化になる可能性が高い。
これ、かなりイヤです。アラートは鳴らないのに、守りが少しずつ痩せる。セキュリティ事故の前兆としては、むしろこちらのほうが現実味があります。

個人的には、この記事は「AIは導入すればするほど良い」という空気に、ちゃんと冷や水をかけている点が価値だと思います。しかも否定していないのがいい。Machine Learning は大量検知に向くし、GenAI は調査の理解を助けるし、Agentic AI は自動実行に強い。問題は、全部を一緒くたにして“AIセキュリティ”と呼んでしまうことです。
実際には、役割もコストも違う。だからこそ、どこにAIを使うか、どのモデルを使うか、どの配備形態にするかを分けて考える必要がある。攻撃者が機械の速度で動くなら、防御側も機械の速度で動くしかない。でも、機械の速度で回すほどお金も減る。この二律背反をどう扱うか。そこに今後の現実的な勝負があるのだと思います。