PaPoo
cover

デジタル庁が国内LLMを公募へ。「源内」で使う“政府向けAI”の中身が見えてきた

デジタル庁が、政府向け生成AI環境「源内(げんない)」で試用する国内開発の大規模言語モデル(LLM)​を公募しました。
しかも、ただの「AIを使ってみます」ではありません。​行政文書に強い、日本語に強い、しかも機密性の高い情報を扱えるAIを探す、かなり実務寄りの取り組みです。

個人的には、これはかなり重要な動きだと思います。
生成AIの話題は派手ですが、政府で本当に使うなら「精度」「安全性」「セキュリティ」「日本語の自然さ」が全部そろっていないと話になりません。今回の公募は、その“現実の壁”に正面から向き合っている印象があります。

まず要点だけ

そもそも「源内」とは何か

「源内」は、デジタル庁が作っている政府職員向けの生成AI利用環境です。
要するに、政府の中で安全にAIを使うための“専用の作業場”のようなものだと考えるとわかりやすいです。

ChatGPTのような一般向けサービスをそのまま公務に持ち込むのではなく、

といった点を、行政向けにきちんと整える必要があります。

この「源内」を、まずはデジタル庁内で使い始め、さらに他省庁へ広げようとしている。今回の公募は、その拡大に合わせて国内製LLMを組み込むための試験という位置づけです。

なぜ国内LLMが必要なのか

記事の背景説明では、日本が抱える人口減少・少子高齢化による担い手不足が強く意識されています。
人手が足りないなら、AIで行政を支えよう、という流れです。これはかなり自然な発想です。

でも、ここで大事なのは「AIなら何でもいい」わけではないこと。
行政の現場では、たとえば次のような事情があります。

だからデジタル庁は、​日本語や行政文書のクセに適した国内開発LLMが重要だとしています。
これはかなり納得感があります。海外の強力なLLMがそのまま日本の役所で“万能”になるとは限らないからです。

公募の狙いは「試して、比べて、育てる」こと

今回の公募は、単にモデルを選ぶだけではありません。
デジタル庁は、令和8年度に次のような流れを想定しています。

  1. 源内上で国内LLMを試験導入
  2. 行政実務での実用性や課題を評価・検証
  3. その結果を国内企業等へ一部フィードバック
  4. 必要に応じてライセンス契約
  5. 令和9年度以降の本格提供を検討

つまり、最初から“完成品”を買うというより、​政府が実際に使いながら、国内LLMを育てていくイメージです。

このやり方は面白いと思います。
AIは、机上のベンチマークだけでは本当の実力が見えにくいからです。役所の現場で使ってみて、初めて見えるクセや弱点がたくさんあります。

対象になるのはどんなモデル?

対象は、​国内で開発されたLLMです。
ただし、少し幅広く設定されています。

含まれるもの

含まれないもの

ここでいうLLMは、ざっくり言えば文章を理解したり、文章を作ったりするAIです。
一方、SLMはLLMより小さめのモデルで、軽量・高速なことが多いです。
「特定ドメイン向けモデル」は、たとえば税務、法務、自治体業務のように、ある分野に特化したAIのことです。

個人的には、ここでSLMや特化モデルまで対象に入れているのが良いなと思います。
現場では“でかいモデルが最強”とは限らず、​用途に合うモデルのほうがむしろ強いことがあるからです。

参加条件はかなり現実的

条件を読むと、デジタル庁が何を重視しているかがかなりはっきり見えます。

1. セキュリティを確保できること

政府職員が​「機密性2情報」​を扱えるよう、十分なセキュリティが必要です。
そのため、​ガバメントクラウド上の推論環境で動作することが求められます。

ここでいう「推論」は、AIに質問を投げて答えを返してもらう処理のことです。
つまり、AIモデルが安全な政府向け基盤の上で動く必要がある、ということです。

2. 海外主要LLMとの比較材料を出せること

ベンチマークテスト結果の提供も必要です。
しかも、単に性能が高いだけでは足りません。

image_0002.svg

特に重視されるのは、

への対策です。

ハルシネーションは、AIがもっともらしく間違ったことを言う現象です。
これ、実務では本当に厄介です。見た目が自然なので、うっかり信用してしまうからです。
だからこそ、行政では「賢そう」より「間違いにくい」が重要なんですよね。

3. 令和8年度は無償提供

2026年度は無償で提供することが条件です。
インフラ費用、つまりガバメントクラウドの基盤費用は、デジタル庁が負担する方向で検討中とのことです。

これは、企業側にとっては参加しやすく、政府側にとっては比較検証を進めやすい設計です。
まずは使ってみる、そのためのハードルを下げる意図が見えます。

4. 行政で実用的な性能があること

当たり前ですが、役所の仕事で使える性能が必要です。
特定ドメイン向けモデルなら、​どの行政分野に効くのかが明確で、しかも一定規模の利用が見込めることが求められます。

5. 複数省庁で使えること

デジタル庁だけでなく、​関係府省庁の職員にも推論提供できることが条件です。
つまり、単なるデジタル庁内の実験で終わらせず、政府全体へ広げる前提です。

6. 技術支援も期待される

国内LLMを使ったAIアプリがうまく動くように、​情報提供やカスタマイズなどの技術支援も求められています。
モデルを渡して終わりではなく、運用まで含めた協力が必要というわけです。

7. 結果の公表に同意すること

評価・検証の一部をデジタル庁が公表することにも同意が必要です。
これは、透明性を確保するうえで大事です。
政府が何を選び、どう評価したのかが見えないと、外からは判断しづらいですからね。

スケジュール感

記事に出ている主なスケジュールは次の通りです。

かなりテンポよく進める計画です。
行政のプロジェクトとしては珍しく、スピード感があるほうだと思います。もちろん、実際は検証や調整で前後する可能性もあるでしょうが、少なくとも「やる気」はかなり伝わってきます。

この取り組みの面白さ

私が特に面白いと思うのは、デジタル庁が**“国産AIを応援する”だけではなく、“政府で使えるか”を基準にしている**点です。

AI業界では、モデルの性能競争が話題になりがちです。
でも政府利用では、以下のような現実が優先されます。

つまり、派手なデモより地味な信頼性。
この路線は、見た目は地味でも、実はかなり本質的です。

率直に言うと、ここが難所

一方で、課題もはっきりしています。
国内LLMを政府で使うとなると、次の壁はかなり高いはずです。

たぶん、ここで重要なのは「一つのモデルで全部やる」発想ではないのだと思います。
用途ごとに向き不向きがあるので、​複数のモデルやアプリを組み合わせる運用が現実的ではないか、というのが私の見方です。

まとめ

今回の公募は、デジタル庁が政府向け生成AI「源内」を本格的に広げるために、​国内開発LLMをどう活かすかを探る取り組みです。

ポイントは、単なる国産推しではなく、
日本語・行政文書・セキュリティ・実用性を全部見たうえで選ぶこと。

生成AIは、便利なだけでは政府では使えません。
でも、そのハードルをちゃんと越えられるなら、行政の現場はかなり変わるはずです。
個人的には、この公募は「日本の行政AIが本当に現場に入るための第一歩」として、かなり注目したいニュースだと思います。


参考: 【終了】ガバメントAIで試用する国内大規模言語モデル(LLM)の公募について|デジタル庁

同じ著者の記事