OpenAIが、Broadcomと共同開発した初のカスタムチップを発表しました。名前は「Jalapeño」。ちょっと辛そうな名前ですが、中身はかなり本気です。これはOpenAI向けに特化した inference processor、つまりAIモデルを実際に動かすための処理装置です。
今回の話で面白いのは、OpenAIが「AIを作る会社」から、だんだん「AIを支えるインフラまで自分で作る会社」になりつつあることです。モデルを作るだけではなく、その下にあるチップやメモリ、ネットワークまで最適化する。かなり野心的だと思います。
Jalapeñoは、OpenAIの推論システムに合わせて設計された専用チップです。ここでいう「推論」は、AIの学習そのものではありません。すでに訓練済みのモデルに対して、「この文章を要約して」「このコードを直して」といった命令が来たときに、実際に答えを返す処理のことです。
AIの世界では、学習が花形に見えます。でも実務では、ユーザーが毎日何百万回も叩くのは推論です。ここが重いと、サービスは遅くなるし、電気代も跳ねます。だからOpenAIが推論専用のチップに手を出したのは、かなり筋がいい判断だと思います。
Broadcomが設計・製造のパートナーになっていて、OpenAI側は自分たちのモデルや知見を開発に使ったとしています。自分のAIを使ってチップを作る、というのはちょっとSFっぽいですが、いまのAI業界ではわりと自然な流れです。
理由はかなりはっきりしています。Nvidiaへの依存を減らしたいからです。
今のAIインフラは、NvidiaのGPUにかなり支えられています。GPUは本来ゲームや画像処理向けに発展したものですが、AI計算にもとても向いていました。ただ、どこも欲しがるので高いし、足りないし、供給も読みにくい。ならば自分たちの用途に合わせたチップを作ったほうがいい、という発想になります。
GoogleもAmazonも、同じように独自のAI向けチップを作ってきました。GoogleのTPUや、AmazonのTrainium・Inferentiaの流れを見ても、「大きなAI企業は最後に半導体まで触りたくなる」ことがよくわかります。というより、触りたくなるというより、触らざるを得ないのでしょう。
今回のJalapeñoは、特に real-time coding models の運用コストを意識しているようです。リアルタイムでコード補助を返すようなモデルは、応答速度も重要ですし、使われる回数も多い。ここで少しでも効率が上がれば、かなり大きい。
記事では、現時点ではまだテスト中だとしつつも、早い段階の結果では「performance-per-watt」がかなり良いとされています。これは要するに、電力1ワットあたりの仕事量が優れている、という意味です。AIチップの世界では、速いだけではなく「どれだけ電気を食わずに動くか」がものすごく大事です。データセンターの電気代は笑えない額になるので、ここを削れるのは本当に効きます。
個人的には、AI業界の次の競争軸は「賢さ」だけでなく「運用のうまさ」だと思っています。モデルの性能差が縮んでくるほど、計算コストや応答速度、安定性で勝負が決まる。Jalapeñoはその流れにぴったり乗っている感じがあります。

重要なのは、OpenAIがすぐに何もかも自社チップに切り替えるわけではなさそうな点です。記事では、より重い pre-training、つまり大規模な事前学習は引き続きNvidiaのハードウェアに頼る可能性が高いとされています。
これは自然です。学習と推論では求められる性質がかなり違います。学習は巨大な計算を一気に回すのが得意な装置が必要ですが、推論は日々の細かな処理を安く、速く、安定して回すことが大事です。全部同じチップでやる必要はありません。
だからこそ、推論専用チップを作るのは合理的です。いわば、マラソン選手に短距離走も全部やらせるのをやめて、それぞれに向いた靴を履かせるようなものです。

OpenAIの発表文で印象的なのは、同社が「モデルや製品を作るだけではなく、その下のインフラも設計している」と強調しているところです。chip architecture、kernels、memory systems、networking、scheduling、deployment systems、product experienceまで最適化する、と。
少し大げさに聞こえるかもしれませんが、これは実際かなり重要です。AIサービスは、モデルの中身だけで勝つ時代から、裏側の総合力で勝つ時代に入っています。チップ、ソフトウェア、データセンター、提供方法。全部がつながって初めて、速くて安くて使いやすいサービスになる。
OpenAIは、その全部を自分たちの目線でそろえにいっているわけです。これは強い。強いけれど、同時にかなり危険でもあると思います。なぜなら、自前化を進めれば進めるほど、失敗したときのダメージも大きくなるからです。とはいえ、巨額の資本を持つAI企業なら、そのリスクを取る価値は十分あるのでしょう。
Jalapeñoの発表は、単なる新製品ニュースではありません。OpenAIが自社の未来を「モデルの性能」だけではなく、「そのモデルをいかに安く回せるか」に賭け始めた、というサインです。
生成AIは便利ですが、裏側ではとにかく金がかかります。推論コストが下がれば、API価格にも影響が出るかもしれないし、より多くのユーザーを抱えられるようにもなる。つまり、ユーザー体験だけでなく事業の持続性にも効いてくる。
個人的には、ここがかなり面白いポイントです。AIの議論というと、つい「どのモデルが賢いか」に目が行きます。でも本当に事業を左右するのは、こういう地味なインフラ戦争だったりします。派手さはないけれど、後から見るとこっちが勝負の分かれ目だった、ということはよくあります。
OpenAIのJalapeñoは、そんな“裏方の本丸”に踏み込んだニュースだと感じます。
参考: OpenAI unveils its first custom chip, built by Broadcom | TechCrunch