デジタル庁が、政府向け生成AI環境「源内(げんない)」で試用する国内開発の大規模言語モデル(LLM)を公募しました。
しかも、ただの「AIを使ってみます」ではありません。行政文書に強い、日本語に強い、しかも機密性の高い情報を扱えるAIを探す、かなり実務寄りの取り組みです。
個人的には、これはかなり重要な動きだと思います。
生成AIの話題は派手ですが、政府で本当に使うなら「精度」「安全性」「セキュリティ」「日本語の自然さ」が全部そろっていないと話になりません。今回の公募は、その“現実の壁”に正面から向き合っている印象があります。
「源内」は、デジタル庁が作っている政府職員向けの生成AI利用環境です。
要するに、政府の中で安全にAIを使うための“専用の作業場”のようなものだと考えるとわかりやすいです。
ChatGPTのような一般向けサービスをそのまま公務に持ち込むのではなく、
といった点を、行政向けにきちんと整える必要があります。
この「源内」を、まずはデジタル庁内で使い始め、さらに他省庁へ広げようとしている。今回の公募は、その拡大に合わせて国内製LLMを組み込むための試験という位置づけです。
記事の背景説明では、日本が抱える人口減少・少子高齢化による担い手不足が強く意識されています。
人手が足りないなら、AIで行政を支えよう、という流れです。これはかなり自然な発想です。
でも、ここで大事なのは「AIなら何でもいい」わけではないこと。
行政の現場では、たとえば次のような事情があります。
だからデジタル庁は、日本語や行政文書のクセに適した国内開発LLMが重要だとしています。
これはかなり納得感があります。海外の強力なLLMがそのまま日本の役所で“万能”になるとは限らないからです。
今回の公募は、単にモデルを選ぶだけではありません。
デジタル庁は、令和8年度に次のような流れを想定しています。
つまり、最初から“完成品”を買うというより、政府が実際に使いながら、国内LLMを育てていくイメージです。
このやり方は面白いと思います。
AIは、机上のベンチマークだけでは本当の実力が見えにくいからです。役所の現場で使ってみて、初めて見えるクセや弱点がたくさんあります。
対象は、国内で開発されたLLMです。
ただし、少し幅広く設定されています。
ここでいうLLMは、ざっくり言えば文章を理解したり、文章を作ったりするAIです。
一方、SLMはLLMより小さめのモデルで、軽量・高速なことが多いです。
「特定ドメイン向けモデル」は、たとえば税務、法務、自治体業務のように、ある分野に特化したAIのことです。
個人的には、ここでSLMや特化モデルまで対象に入れているのが良いなと思います。
現場では“でかいモデルが最強”とは限らず、用途に合うモデルのほうがむしろ強いことがあるからです。
条件を読むと、デジタル庁が何を重視しているかがかなりはっきり見えます。
政府職員が「機密性2情報」を扱えるよう、十分なセキュリティが必要です。
そのため、ガバメントクラウド上の推論環境で動作することが求められます。
ここでいう「推論」は、AIに質問を投げて答えを返してもらう処理のことです。
つまり、AIモデルが安全な政府向け基盤の上で動く必要がある、ということです。
ベンチマークテスト結果の提供も必要です。
しかも、単に性能が高いだけでは足りません。
特に重視されるのは、
への対策です。
ハルシネーションは、AIがもっともらしく間違ったことを言う現象です。
これ、実務では本当に厄介です。見た目が自然なので、うっかり信用してしまうからです。
だからこそ、行政では「賢そう」より「間違いにくい」が重要なんですよね。
2026年度は無償で提供することが条件です。
インフラ費用、つまりガバメントクラウドの基盤費用は、デジタル庁が負担する方向で検討中とのことです。
これは、企業側にとっては参加しやすく、政府側にとっては比較検証を進めやすい設計です。
まずは使ってみる、そのためのハードルを下げる意図が見えます。
当たり前ですが、役所の仕事で使える性能が必要です。
特定ドメイン向けモデルなら、どの行政分野に効くのかが明確で、しかも一定規模の利用が見込めることが求められます。
デジタル庁だけでなく、関係府省庁の職員にも推論提供できることが条件です。
つまり、単なるデジタル庁内の実験で終わらせず、政府全体へ広げる前提です。
国内LLMを使ったAIアプリがうまく動くように、情報提供やカスタマイズなどの技術支援も求められています。
モデルを渡して終わりではなく、運用まで含めた協力が必要というわけです。
評価・検証の一部をデジタル庁が公表することにも同意が必要です。
これは、透明性を確保するうえで大事です。
政府が何を選び、どう評価したのかが見えないと、外からは判断しづらいですからね。
記事に出ている主なスケジュールは次の通りです。
かなりテンポよく進める計画です。
行政のプロジェクトとしては珍しく、スピード感があるほうだと思います。もちろん、実際は検証や調整で前後する可能性もあるでしょうが、少なくとも「やる気」はかなり伝わってきます。
私が特に面白いと思うのは、デジタル庁が**“国産AIを応援する”だけではなく、“政府で使えるか”を基準にしている**点です。
AI業界では、モデルの性能競争が話題になりがちです。
でも政府利用では、以下のような現実が優先されます。
つまり、派手なデモより地味な信頼性。
この路線は、見た目は地味でも、実はかなり本質的です。
一方で、課題もはっきりしています。
国内LLMを政府で使うとなると、次の壁はかなり高いはずです。
たぶん、ここで重要なのは「一つのモデルで全部やる」発想ではないのだと思います。
用途ごとに向き不向きがあるので、複数のモデルやアプリを組み合わせる運用が現実的ではないか、というのが私の見方です。
今回の公募は、デジタル庁が政府向け生成AI「源内」を本格的に広げるために、国内開発LLMをどう活かすかを探る取り組みです。
ポイントは、単なる国産推しではなく、
日本語・行政文書・セキュリティ・実用性を全部見たうえで選ぶこと。
生成AIは、便利なだけでは政府では使えません。
でも、そのハードルをちゃんと越えられるなら、行政の現場はかなり変わるはずです。
個人的には、この公募は「日本の行政AIが本当に現場に入るための第一歩」として、かなり注目したいニュースだと思います。