世界の技術ニュースをリアルタイムでキャッチし、日本語でわかりやすく発信。AI・半導体・スタートアップから規制動向まで、グローバルテックシーンの「今」をお届けします。

2026-05-30

大規模LLMサーバーを建てる前に“仮想で試す”KAISTのシミュレーターが面白い

KAISTが、大規模LLMサーバーの性能を実機なしで事前検証できる virtual testbed を開発した
研究成果は ISPASS 2026でBest Paper Award を受賞
ツール名は LLMServingSim 2.0
GPUだけでなく、NPU や PIM など次世代AI向けハードウェアも扱える
実際の巨大データセンター級の構成を作る前に、速度・電力・安定性 を比較できるのが強み
AIサービス企業やAI半導体スタートアップにも役立つ可能性が高い

まず何が起きたのか

Tech Xploreの記事によると、韓国のKAIST（韓国科学技術院）の研究チームが、LLM（Large Language Model）を動かす大規模サーバー環境を、実際に作る前にコンピューター上で検証できるシミュレーターを開発しました。

このシミュレーターは LLMServingSim 2.0 と呼ばれ、複雑なAIサービスの構成を“仮想的に”再現します。しかもただの机上の空論ではなく、ISPASS 2026でBest Paper Awardを受賞したというのがポイントです。研究としてかなり評価された、ということですね。

個人的にはここがかなり重要だと思います。AIの話って「モデルがすごい」で終わりがちですが、実際にはそのモデルを支えるサーバーや配線、メモリ、電力、分散処理の設計がめちゃくちゃ重要です。ChatGPTのようなサービスは、見えない裏側が本体みたいなものですから。

なぜこんなシミュレーターが必要なのか

LLMサービスを大規模に運用するには、数万台規模のサーバーが必要になることがあります。
これを実機で毎回組んで検証するのは、正直かなり無茶です。

サーバーを買うお金がかかる
組み立てる時間がかかる
新しい半導体や構成を試すたびに、また大規模実験が必要になる
間違えるとコストが大惨事になる

つまり、「試してみたいけど、試すだけで高い」 というAIインフラの悩みを解決するのが、この種のシミュレーターです。

これはかなり現実的な発想だと思います。AI業界って、モデルの性能競争の裏で、ハードウェアとデータセンターの最適化競争も激しいんですよね。そこに“仮想の実験場”を用意するのは、かなり筋がいいです。

LLMServingSim 2.0 でできること

このツールは、さまざまなハードウェアとソフトウェアの組み合わせを仮想環境で分析できます。
つまり、次のようなことを建設前に試せるわけです。

どの構成が一番速いか
電力消費をどれだけ減らせるか
大規模化しても安定して動くか
どのハードウェアが将来向きか

ここで登場するのが、NPU と PIM です。

NPUって何？

NPUは Neural Processing Unit の略で、AI計算に特化した半導体です。
ざっくり言うと、AI向けに仕事をしやすくした専用CPUみたいなものです。

PIMって何？

PIMは Processing-In-Memory の略で、メモリの中で計算を行う技術です。
普通は「データをメモリからCPUへ運んで計算する」のですが、PIMはその移動を減らして効率を上げようとします。

この2つは、いずれも次世代AIインフラの有力候補です。
特に面白いのは、まだ広く商用化されていない未来の半導体まで、仮想データセンター内で事前に試せる点です。これはかなり夢があります。

ただ速さを見るだけじゃないのが良い

記事では、このシミュレーターが単にベンチマークを回すだけではなく、実際のAIサービスで起きる複雑な動きも再現できると説明しています。

たとえば：

データ処理
リクエストの振り分け
メモリの使い方

こうした処理をシステムレベルで再現するので、現実に近い評価ができるのが強みです。

ここが地味にすごいところです。
単純に「理論上は速いです」ではなく、サービスとして本当に回るかを見るのは別問題ですから。AIサーバーって、ピーク性能だけ高くても、実運用で詰まったら意味がないんですよね。

分散型インフラにも対応

このシミュレーターは、disaggregated infrastructure にも対応しています。
これは少し難しい言葉ですが、要するに複数のサーバー資源をバラして、必要に応じてつなげて使う構成です。

たとえば、計算用・メモリ用・ストレージ用の資源を分けて設計するようなイメージです。
こうした構成は、次世代データセンターではかなり重要になりそうだと考えられています。

個人的には、今後のAIインフラは「巨大な箱を1個作れば終わり」ではなく、用途ごとに部品を組み合わせる方向にもっと進むのではないかと思います。だから、このシミュレーターがそこまで見ているのはかなり本気度が高いです。

誰に役立つのか

このツールは、研究者だけでなく、次のような人たちに役立つと期待されています。

LLMサービス企業
AI半導体スタートアップ
データセンター設計に関わるエンジニア
次世代AIインフラを検討する研究者

理由はシンプルで、新しい半導体やサービス構成を、実際に作る前に素早く検証できるからです。
これにより、AIインフラ開発のコストと時間を大きく削減できる可能性があります。

これはかなり実務的な価値があると思います。
AI分野は華やかに見えて、最後は「電気代」「冷却」「安定運用」「調達コスト」が勝負になるので、こういうツールの地味な強さは侮れません。

研究者のコメントが示すもの

KAISTのJongse Park教授は、
AIサービスの競争力はモデルそのものだけでなく、それを安定かつ効率的に動かすインフラ技術でも決まる
と述べています。

これはまさにその通りだと思います。
どんなに賢いモデルでも、動かす土台が弱ければ、結局は遅い・高い・不安定、になってしまいます。AIの競争は、見える部分だけでなく、裏側の設計力で決まる時代に入っているのではないでしょうか。

この記事の見どころ

このニュースの面白さは、単なる「新しいAIツールが出た」ではないところです。
本質は、AIの未来はソフトウェアだけではなく、サーバー設計や半導体設計まで含めた総合戦になっているという点にあります。

そして、その総合戦を現実に建てる前に仮想空間で先に戦わせる。
この発想は、かなり賢いし、かなり実用的です。

私はこういう「作る前に徹底的に試す」系の技術が大好きです。失敗のコストが高すぎる分野では、仮想検証の価値はどんどん増していくはずです。AIデータセンターはまさにその典型だと思います。

参考: Virtual AI testbed lets developers verify massive LLM servers before construction

同じ著者の記事

Excelのフォントが変わる原因を、.xlsxを解凍して確かめてみた

「テーマフォントが原因」というところまでは、探せば辿り着ける。だが実際にファイルの中で何が参照し合っているのかを見た人は少ない。.xlsxはただのZIPなので、覗くのに5分もかからない。手元の適当なブックで試すなら、拡張子を`.zip`に変えるか`unzip`コマンドを叩くだけでいい。 ``` $ unzip -l sample.xlsx Length Date Time Name --------- ---------- ----- ---- 1234 2026-07-01 09:00 xl/theme/theme1.xml 5678 2026-07-01 09:00 xl/styles.xml ... 2345 2026-07-01 09:00 xl/worksheets/sheet1.xml ``` 犯人は`xl/theme/theme1.xml`にいる。中を`cat`すると、こんな塊が出てくる。 ```xml <a:fontScheme name="Office"> <a:majorFont> <a:latin typeface="

papoo.work

Claude の Effort、実は3段階じゃない——xhigh/maxまで含めた5段階の使い分けとAPI仕様を深掘りする

以前の記事「[Claude の effort ってどう効くの？](https://note.com/modern_ferret431/n/nc8e88b771ab0)」では、Effortパラメータを Low / Medium / High の3段階として紹介した。実際のClaude APIはもう一段深い。現行モデル（Opus 4.8/4.7、Sonnet 5、Fable 5）では low / medium / high / xhigh / max の5段階が存在し、しかも「thinkingの予算」だった旧`budget_tokens`とは効かせ方そのものが違う。本稿ではAPI仕様に基づいて、モデル別の対応状況・挙動の違い・実運用での設計指針を整理する。旧世代（Sonnet 4.5以前）の extended thinking は `thinking: {type: "enabled", budget_tokens: N}` という固定トークン予算の指定だった。「thinkingにいくら使うか」だけを制御する、いわば一次元のノブだ。 Opus 4.6以降ではこれが非推奨化

papoo.work

Claudeの「超過課金」は自動発生しない——note記事の補足と2026年6月の仕様変更

先日、[「Claudeは weekly limit や 5hours limit を突き破ったときのペナルティ料金が半端ない」](https://note.com/modern_ferret431/n/n821d3055d109) という記事が話題になった。Claude CodeやOpusでコードベース解析を回していると、10分足らずで従量課金が発生し得るという警告は実体験として貴重だが、エンジニアが実際に運用判断をする上で誤解しやすいポイントがいくつかある。本記事はその補足として、Anthropic公式ドキュメントに基づき仕組みを整理する。最大の誤解ポイントはここ。Claude Pro/Maxで週次・5時間の利用上限に達しても、Usage credits（超過課金）を明示的に有効化していない限り、追加料金は一切発生しない。上限に達した場合の既定動作は「リセットまで待つ」だけで、勝手にAPI従量課金へ切り替わることはない。有効化するには以下の手順が必要: `Settings > Usage` から Usage credits セクションで Enable をクリック

papoo.work

【2026年7月版】Outlookが「起動しない・クラッシュを繰り返す」最新事情 — 6月末の一斉クラッシュはビルド2605が原因、直し方はほぼ一択

「昨日まで普通に使えていたClassic Outlookが、右クリックした瞬間に落ちる」「起動してもすぐ強制終了し、次はセーフモードで開く」——2026年6月末から、この手の悲鳴がまた一気に増えた。半年前・1年前に書かれた「Outlookが起動しない完全解決ガイド」的な記事が今また読まれているのは、まさに今、Classic Outlookのクラッシュが立て続けに起きているからだ。本稿は、2026年前半に発生した複数のクラッシュ事案を発生時期・影響ビルド・原因・修正状況で整理し直し、「自分のケースはどれで、何をすれば直るか」を最短で切り分けられるようにしたものだ。結論から言うと、直近の主犯は更新プログラムの回帰（リグレッション）で、多くは“Officeを最新へ更新するだけ”で直る。設定を9個いじる前に、まずここを見たほうが早い。 > ⚠️ 先に結論: 2026年6月29日ごろから急にClassic Outlookが落ち始めたなら、疑うべきは自分の設定ではなく **Microsoft 365 Apps バージョン2605（Build 20026.20182

papoo.work

【2026年7月版】Outlookの「送信済みメールが消える」が再燃 — 犯人はWindows更新プログラム KB5074109 の可能性

「送信は成功したのに、送信済みアイテムに残っていない」——Outlookの定番トラブルが、2026年に入ってから再び相談件数を増やしている。半年前(2026年1月)に出回った解説記事の手順は今でも基本として有効だが、2026年に急増した“送信済みが消える”の主犯は、従来の設定ミスではなく Windows のセキュリティ更新プログラムそのものであることが分かってきた。本稿はその現況を、切り分け順に整理し直したものだ。 > ⚠️ 先に結論: 1月中旬以降にClassic Outlook(デスクトップ版)で急に「送信済みに入らない」「Outlookが固まる」が始まったなら、まず疑うべきは自分の設定ではなく 更新プログラム KB5074109 と PSTファイルの置き場所(OneDrive配下かどうか) だ。設定を10個いじる前に、ここを先に見たほうが早い。 --- 2026年1月のWindowsセキュリティ更新 KB5074109 導入後、**Classic Outlookで送信メールが「送信済みアイテム」に記録されない／Outlookが終了しない・フ

papoo.work

【続報】サナエトークン、ついに「当事者2人の法廷闘争」へ――三崎優太氏が溝口勇児氏に内容証明、いまどこまで進んだか

前回まで、私たちはサナエトークン騒動を「補償」「金融庁」「高市首相の否定」という3つの軸で追ってきた。補償は6月10日に申請サイトが開き、金融庁の損失相談は6月時点で5件、首相は国会で改めて全面否定――というのが直近の現在地だった。ところが騒動はここへ来て、まったく別の局面に入っている。行政・補償の話から、当事者どうしの個人間紛争、それも法廷闘争へと重心が移ったのだ。本稿はその続報である。 https://papoo.work/doc/7de9f0cf1b564dc9 実業家の三崎優太氏（元「青汁王子」）が、実業家の溝口勇児氏に内容証明を送付したと明かし、「きっと裁判になる」と法廷闘争を予告した。三崎氏は溝口氏とみられる人物の会議音声を公開し、「責任を他人になすりつけている（＝トカゲの尻尾切り）」と批判。溝口氏は「編集で切り取っている」「補償対応はやっている」と反論した。 6月26日、三崎氏は両者が共同運営していたYouTube番組「REAL VALUE」からの脱退を表明。ただし本稿執筆時点（7月7日）で、**正式な「提訴」の公

papoo.work

ブラウン大学で起きた「AIカンニング」騒動、大学の信頼はどう守るのか

ブラウン大学の経済学者ロベルト・セラーノ教授が、担当科目の試験で少なくとも50人がAIを使って不正をしたと訴えている。問題になったのは、持ち帰って解く形式の試験。自宅でじっくり考えられる反面、ChatGPTのようなAIを使いやすい。期末試験では平均点が一気に落ち、欠席者の多くが前回満点だったことから、教授は「証拠は圧倒的」と見ている。ブラウン大学の反応は鈍く、教授は「大学全体で学問の誠実さを守る議論が必要だ」と主張している。背景には、米国の名門大学で広がるAI利用の誘惑と、教育のあり方そのものを揺さぶる問題がある。ブラウン大学で起きたこの話、かなり重いです。しかも、ただの「試験でズルした人がいました」という話では終わりません。大学が長年かけて築いてきた信頼、つまり「ここで学んだ学生の成績には意味がある」という前提そのものが、AIの登場でぐらついている。この記事は、その現場で何が起きているのかをかなり生々しく伝えています。中心にいるのは、ブラウン大学の著名な経済学者ロベルト・セラーノ教授です。彼は、数学的経済学の上級学部生向け講義 ECON 1170 を担当していて、

papoo.work

AIにMRIを読ませたら、医師と真逆の答えが出た話

肩が痛い。だからMRIを撮った。そこまではよくある話です。ところがこのブログ記事は、そこで終わりません。著者はそのMRI画像を、OpenAI系のモデルではなく、Claude Code上で動かしたOpus 4.8に読ませて、「もう一つの診断」を引き出そうとします。で、出てきた答えがかなり衝撃的でした。医師は「腱板の部分断裂（Grade III）」と見たのに、AIは「腱は保たれている」と判断したんです。この差、かなり大きいです。しかも著者は、ただAIに雑に投げたわけではありません。DICOM形式のMRIデータを用意し、Claude Codeに必要なパッケージを入れさせ、かなり本気で解析させています。単なるお遊びではなく、「AIが医療画像をどこまで読めるのか」を自分の体で試した記録、と言ったほうが近いです。肩の痛みでMRIを撮った著者が、AIに画像の再読影をさせた人間の医師は「Grade IIIの部分断裂」と判断した Opus 4.8は最初、「腱は正常」と報告したその後、別の条件で再比較させた結果、AIは「明らかな断裂は見当たらない」と結論づけたただし著者自身は、AIも医師も完全に

papoo.work

AIコーディングは「レビュー」より「テスト」で殴るほうが強い、という話

著者は、AI coding を使っていると「人間なら即クビ」レベルの妙な挙動に何度も遭遇したが、それでも利用をやめるどころか、さらに使い込むようになった。この記事の中心テーマは、AI にコードを書かせるときは code review 以上に test process が大事 だ、という主張。その根拠として、著者は昔働いていた CPU 設計会社 Centaur のテスト文化を紹介する。そこでは、手書きテストより fuzzing や random testing を重視し、unit test はほぼ使わず、専任の test engineer がいた。著者は、AI 時代の開発でも「人間が全部レビューする」より、「大量の自動テストで叩く」ほうが現実的で、しかも強いと考えている。ただし、これは単なる理想論ではなく、実際にバグを見つけて直してきた現場の感覚から来ている。本文を読んでまず面白いのは、著者の出発点がかなり変わっていることです。AI coding を「便利な補助輪」ではなく、かなり攻めた実験装置として見ています。しかも、その最初の印象がすごい。バ

papoo.work

Apple Neural Engineの中身を、かなり踏み込んで覗いた研究

Appleの「Neural Engine」、通称ANEは、iPhoneやMacの中で静かに働く専用チップです。顔認識、写真の補正、音声処理、生成AIの一部まで、裏側でかなり多くの仕事を抱えています。ふだんはCore MLというApple公式の仕組み越しにしか使えないので、一般の開発者から見ると「中はブラックボックス」の代表格でした。今回のarXiv論文は、そのブラックボックスをかなり本気で分解したものです。しかも単なる憶測ではなく、Apple silicon上での直接計測と、private runtime、compiler、kernel driver、firmwareの静的解析を組み合わせている。こういう研究は地味に見えて、実はとても面白いです。Appleが“使わせるつもりのない層”にまで手を伸ばして、仕組みを記述しているわけですから。この論文は、Apple Neural Engineのアーキテクチャ、プログラミング方法、性能の限界をまとめた「リバースエンジニアリングのガイド」です。対象はA11世代のiPhone/iPadチップからA18、そしてM1からM5まで。かなり広い。特に

papoo.work