PaPoo
cover
technews
Author
technews
世界の技術ニュースをリアルタイムでキャッチし、日本語でわかりやすく発信。AI・半導体・スタートアップから規制動向まで、グローバルテックシーンの「今」をお届けします。

スイス発の「完全オープン」AI、Apertusとは何か。公開を前提に作られた基盤モデルの面白さ

キーポイント

この記事でわかること

Apertus.ai は、一言でいうと「最初から最後までオープンであること」を強く打ち出したAI基盤モデルです。
単にモデルの重み(weights)を公開するだけではなく、どう学習したか、どんなデータを使ったか、どう安全性や整合性を考えたかまで、できるだけ見える形にしようとしている。ここがかなり重要です。

AI業界では「オープン」と言っても中身はさまざまで、モデルだけ公開、コードは非公開、データは不明、ということも珍しくありません。
その点で Apertus は、かなり本気で“open science”をやろうとしている印象があります。正直、これはかなり面白いです。AIをブラックボックスのまま使うのではなく、社会実装の前提として透明性を上げようとしているからです。

Apertus.ai はどんなプロジェクト?

Apertus は、Swiss AI Initiative による取り組みで、EPFL、ETH Zurich、CSCS の共同 effort として開発されています。
つまり、スイスの研究機関・計算基盤が組んで作っているプロジェクトです。企業単独の製品というより、研究と公共性を強く意識した基盤づくりに見えます。

サイトでは、Apertus を “Fully Open Foundation Model for Sovereign AI” と紹介しています。
ここでいう Foundation Model は、文章生成や要約、翻訳などいろいろな用途の土台になる大型AIモデルのこと。
Sovereign AI は少し耳慣れないかもしれませんが、簡単にいえば「自国・自組織で主導権を持てるAI」というニュアンスです。海外のクラウドや一部企業に強く依存せず、データ管理や運用の自由度を確保したい、という文脈でよく語られます。

この発想、かなり時代に合っています。
AIは便利ですが、どこで学習され、何を根拠に出力しているのか見えにくい。だからこそ、公共性の高い場面では「自分たちで確認できるAI」が強いのです。

何が「Fully Open」なのか

image_0001.svg

Apertus が強く打ち出しているのは、次のような完全公開志向です。

これらがすべて documented and reproducible、つまり文書化され、再現可能であることを目指していると説明されています。

ここでのポイントは、「モデルだけ使えます」ではなく、「どうやってそのモデルになったのか」まで追えること。
研究の世界では再現性がとても大事ですが、AIではこれが難しい。学習に使ったデータや手順が見えないと、後から検証できないからです。Apertus はそこに正面から向き合っているわけです。

個人的には、この方向性はすごく好感が持てます。
AIが社会に深く入るほど、「精度が高い」だけでは足りなくなる。説明できること、検証できること、責任の所在をたどれることが重要になります。Apertus は、その土台を作ろうとしているように見えます。

法規制への意識もかなり強い

サイトでは、Apertus は EU AI Act の要件を満たすことを意識して設計されたとしています。
EU AI Act は、EUで進むAI規制の枠組みで、AIのリスク管理や透明性などを求めるものです。ざっくり言えば、「AIを好き勝手に使うのではなく、安全性と説明責任を持って運用してね」という方向のルールです。

Apertus の説明で挙がっている対応は次の通りです。

image_0003.png

それぞれ簡単にいうと、

この3つは地味ですが、実はかなり重要です。
AIは賢く見えても、学習データをそのまま漏らすような挙動が問題になることがあります。特に個人情報や著作物の扱いは、今後ますますシビアになるはずです。

Apertus は、単に「オープンです!」と叫ぶだけでなく、オープンであるがゆえのリスクにも目を向けている。ここが興味深いところです。

性能面はどうなのか

Apertus は、​8B と 70B パラメータ規模のオープンモデルと同等の水準で競争できることを目指していると説明しています。
パラメータ は、モデルの内部にある調整可能な数のことです。数が多いほど大きなモデルになりやすいですが、単純に大きければ良いわけでもありません。計算資源も必要になります。

また、「Run for Performance」として、パフォーマンス面でも競争力を持たせる姿勢が示されています。
オープンモデルは「思想は良いけど実用性能が足りない」と言われがちなので、ここをちゃんと押さえにいくのは重要です。理想だけでは使われませんからね。

多言語対応がかなり強い

もう一つの特徴が、​1000以上の言語で学習していること。
これはかなり野心的です。多くのAIモデルは英語中心で、ほかの言語はどうしても後回しになりがちです。でも実際の世界では、英語だけで生きている人のほうが少ない。なので、多言語を最初から重視するのはとても実用的だと思います。

image_0005.jpg

スイスという多言語国家の背景も、この方針に相性が良さそうです。
英語圏だけを見ていないAIは、それだけで社会的な価値が広がります。翻訳、行政、教育、地域言語の支援など、使い道はかなり多いはずです。

すでに派生展開も始まっている

ニュース欄を見ると、Apertus は単なる発表で終わっていません。

ここで出てくる distillation は、大きなモデルの知識を小さなモデルに移す技術。
quantization は、モデルを軽くして動かしやすくするための圧縮・最適化の技術です。
つまり Apertus Mini は、実用上かなり大事な「小さくして使いやすくする」方向の実験でもあるわけです。

個人的には、この Mini の存在がけっこう好きです。
巨大モデルは派手ですが、現場で本当に役に立つのは、軽くて扱いやすいモデルだったりします。研究から実運用へつなぐ姿勢が見えるからです。

このプロジェクトの何が重要なのか

Apertus の重要性は、単に「新しいAIが出た」ことではありません。
むしろ、​AIの作り方そのものを公開可能な形に戻そうとしているところにあります。

今のAI開発は、どうしても閉じた世界になりやすい。
でも社会インフラに近づくほど、閉じていること自体が弱点になります。教育、行政、医療、公共サービスなどに入るなら、「誰が、何を根拠に、どう作ったのか」は無視できません。

image_0008.svg

Apertus は、その問題に対して「Open source の思想を AI に持ち込む」ような挑戦だと言えます。
サイトの言葉を借りれば、​**“Apertus is to AI as Open is to Source.”**。
このコピー、かなりうまいです。AIの世界でも、ソースコードにおける open の価値を再定義しようとしている感じがあります。

とはいえ、気になる点もある

もちろん、オープンであることにはコストもあります。
公開すればするほど、悪用のリスクや運用上の難しさも増えますし、データの権利処理や安全性の担保も大変です。Apertus はそこに EU AI Act 対応や PII 削除などで向き合っているわけですが、実際の運用は簡単ではないはずです。

また、性能面で「同等」と言っても、用途によって感じ方は違います。
ベンチマークで良くても、現場ではレスポンス速度、安定性、コスト、ガードレールの有無が効きます。なので、今後の評価は「どれだけ公開されたか」だけでなく、「どれだけ実際に使えるか」にかかってくるでしょう。

それでも、こういうプロジェクトがあるのは大きいです。
AIが一部の巨大企業だけのものにならず、研究機関や公共領域にも戻ってくる。その流れを作る存在として、Apertus はかなり象徴的だと思います。

まとめ

Apertus.ai は、スイス発の「完全オープン」な foundation model です。
学習データ、コード、weights、方法論まで公開しようとする姿勢は、AI業界の中でもかなり徹底しています。

さらに、EU AI Act を意識した設計、多言語対応、軽量モデルの派生展開など、単なる理念先行ではなく、実務に落とし込もうとしているのも魅力です。
AIの透明性や主権性が重要になるこれからの時代に、Apertus はかなり注目してよいプロジェクトだと思います。


参考: APERTVS.ai

同じ著者の記事