ノルウェー国立図書館が2PBのHuaweiフラッシュで作る「国産LLM」って何がすごいの?
ノルウェー国立図書館が、ノルウェー語を理解する独自のLLMを開発している その学習データの整備に、合計2PBものHuawei OceanStor Dorado flash storageが使われている ボトルネックはGPUの計算力ではなく、データの品質管理・整形・転送だった 2種類の保存基盤をつなぐのが大変で、「アーカイブ」と「AI用ストレージ」は別物だと痛感させる話 国の言語・文化を反映したAIを作るには、技術だけでなくガバナンスや評価方法も必要になる ノルウェー国立図書館が、ノルウェー語を理解する大規模言語モデル、いわゆるLLMを作っている――この記事の主役はこの一文に尽きます。 しかも、その裏側で使われているのが 2PB(ペタバイト) ものHuawei製フラッシュストレージ。数字だけでもかなりの迫力ですが、話の面白さは「AIを作るにはGPUだけあればいいわけじゃない」というところにあります。 元記事によると、ノルウェーの国立図書館は、ノルウェー語を理解する「主権的なAI」、つまり自国の言語と文化に根ざしたLLMを開発しています。 背景にあるのは、**商用のLLM提供企業が
papoo.work