世界の技術ニュースをリアルタイムでキャッチし、日本語でわかりやすく発信。AI・半導体・スタートアップから規制動向まで、グローバルテックシーンの「今」をお届けします。

2026-06-26

OpenAIがBroadcomと作った初の自社チップ「Jalapeño」、狙いは“推論”の効率化

OpenAIが、Broadcomと共同開発した初のカスタムチップを発表しました。名前は「Jalapeño」。ちょっと辛そうな名前ですが、中身はかなり本気です。これはOpenAI向けに特化した inference processor、つまりAIモデルを実際に動かすための処理装置です。

今回の話で面白いのは、OpenAIが「AIを作る会社」から、だんだん「AIを支えるインフラまで自分で作る会社」になりつつあることです。モデルを作るだけではなく、その下にあるチップやメモリ、ネットワークまで最適化する。かなり野心的だと思います。

まず押さえたいポイント

OpenAIがBroadcomと共同で、初の自社向けカスタムチップ「Jalapeño」を発表
用途は inference、つまり学習済みAIをユーザーの命令に応じて動かす場面
OpenAIは、自社AIモデルもチップ開発に活用したという
まだテスト段階だが、現行の最先端チップより performance-per-watt がかなり良いとされる
Nvidiaへの依存を減らす狙いがある
生成AIの事業では、推論コストの削減がそのまま利益改善につながりやすい

どういうチップなのか

Jalapeñoは、OpenAIの推論システムに合わせて設計された専用チップです。ここでいう「推論」は、AIの学習そのものではありません。すでに訓練済みのモデルに対して、「この文章を要約して」「このコードを直して」といった命令が来たときに、実際に答えを返す処理のことです。

AIの世界では、学習が花形に見えます。でも実務では、ユーザーが毎日何百万回も叩くのは推論です。ここが重いと、サービスは遅くなるし、電気代も跳ねます。だからOpenAIが推論専用のチップに手を出したのは、かなり筋がいい判断だと思います。

Broadcomが設計・製造のパートナーになっていて、OpenAI側は自分たちのモデルや知見を開発に使ったとしています。自分のAIを使ってチップを作る、というのはちょっとSFっぽいですが、いまのAI業界ではわりと自然な流れです。

なぜわざわざ自社チップなのか

理由はかなりはっきりしています。Nvidiaへの依存を減らしたいからです。

今のAIインフラは、NvidiaのGPUにかなり支えられています。GPUは本来ゲームや画像処理向けに発展したものですが、AI計算にもとても向いていました。ただ、どこも欲しがるので高いし、足りないし、供給も読みにくい。ならば自分たちの用途に合わせたチップを作ったほうがいい、という発想になります。

GoogleもAmazonも、同じように独自のAI向けチップを作ってきました。GoogleのTPUや、AmazonのTrainium・Inferentiaの流れを見ても、「大きなAI企業は最後に半導体まで触りたくなる」ことがよくわかります。というより、触りたくなるというより、触らざるを得ないのでしょう。

OpenAIが狙っているのは、たぶん“コストの本丸”

今回のJalapeñoは、特に real-time coding models の運用コストを意識しているようです。リアルタイムでコード補助を返すようなモデルは、応答速度も重要ですし、使われる回数も多い。ここで少しでも効率が上がれば、かなり大きい。

記事では、現時点ではまだテスト中だとしつつも、早い段階の結果では「performance-per-watt」がかなり良いとされています。これは要するに、電力1ワットあたりの仕事量が優れている、という意味です。AIチップの世界では、速いだけではなく「どれだけ電気を食わずに動くか」がものすごく大事です。データセンターの電気代は笑えない額になるので、ここを削れるのは本当に効きます。

個人的には、AI業界の次の競争軸は「賢さ」だけでなく「運用のうまさ」だと思っています。モデルの性能差が縮んでくるほど、計算コストや応答速度、安定性で勝負が決まる。Jalapeñoはその流れにぴったり乗っている感じがあります。

ただし、全部を置き換えるわけではなさそう

重要なのは、OpenAIがすぐに何もかも自社チップに切り替えるわけではなさそうな点です。記事では、より重い pre-training、つまり大規模な事前学習は引き続きNvidiaのハードウェアに頼る可能性が高いとされています。

これは自然です。学習と推論では求められる性質がかなり違います。学習は巨大な計算を一気に回すのが得意な装置が必要ですが、推論は日々の細かな処理を安く、速く、安定して回すことが大事です。全部同じチップでやる必要はありません。

だからこそ、推論専用チップを作るのは合理的です。いわば、マラソン選手に短距離走も全部やらせるのをやめて、それぞれに向いた靴を履かせるようなものです。

OpenAIは“モデル会社”から“基盤会社”に寄っている

OpenAIの発表文で印象的なのは、同社が「モデルや製品を作るだけではなく、その下のインフラも設計している」と強調しているところです。chip architecture、kernels、memory systems、networking、scheduling、deployment systems、product experienceまで最適化する、と。

少し大げさに聞こえるかもしれませんが、これは実際かなり重要です。AIサービスは、モデルの中身だけで勝つ時代から、裏側の総合力で勝つ時代に入っています。チップ、ソフトウェア、データセンター、提供方法。全部がつながって初めて、速くて安くて使いやすいサービスになる。

OpenAIは、その全部を自分たちの目線でそろえにいっているわけです。これは強い。強いけれど、同時にかなり危険でもあると思います。なぜなら、自前化を進めれば進めるほど、失敗したときのダメージも大きくなるからです。とはいえ、巨額の資本を持つAI企業なら、そのリスクを取る価値は十分あるのでしょう。