OpenAIは、自社の「動力」をどう確保するかという計画を変えた。米国時間6月24日、OpenAIは「Jalapeño」(ハラペーニョ)を発表した。ブロードコムと共同で開発した同社初の独自チップであり、用途特化型のプロセッサーだ。狙いはただ1つ、推論である。学習済みモデルを「教える」のではなく「動かす」作業だ。この一手は、汎用ハードウェアへの依存から、モデルからシリコンに至るまでOpenAIが制御する垂直統合型スタックへと舵を切る、意図的なステップである。
それが戦略だ。そして投資の観点で重要なのは、OpenAIのさらに1層下にある部分に位置している。カスタムチップはソフトウェア企業が単独で作れるものではない。設計図、パッケージング、製造に関する関係性を握るパートナーが必要であり、OpenAIはブロードコムをその相手に見出した。カスタムチップに自社名を刻む企業と、そこから持続的な利益を得る企業が同じであることは、ほとんどない。
「Jalapeño」(ハラペーニョ)とは何か
ハラペーニョはASIC(特定用途向け集積回路)であり、グラフィックスプロセッサー(GPU)のような汎用的な柔軟性ではなく、単一の狭い目的のために設計されたチップだ。ターゲットは、大規模言語モデル(LLM)の処理速度を低下させるメモリーボトルネックである。物理設計では、大型の演算セクションと6基の高帯域幅メモリー(HBM)スタックを組み合わせ、データの高速転送を実現している。さらにデータパスをシリコン上で直接最適化することで、AIエージェントが生み出す複雑で多段のワークロードを動かすのに必要な電力を削減する。
ブロードコムCEOのホック・タンは、ハラペーニョが一般的なAI向けGPUと比べて、推論を約半分のコストで実行できると述べている。
ただ、この数字は少し距離を置いて見るべきだ。ブロードコム自身の数値であり、OpenAIが選んだワークロードで測定されたもので、独立したベンチマークもない。従って正確な割合はマーケティングとして扱うのが妥当だ。重要なのは方向性である。単一タスク向けに設計されたチップは、通常そのタスクでは汎用チップを上回れる。そして推論は、請求が途切れないコストなのだ。
推論に狙いを定める理由は、結局のところ「金の流れ」にある。モデルの学習は、1度きりの莫大な費用だ。推論は繰り返し発生する費用であり、あらゆる回答、あらゆるエージェントのステップが、1日に何十億回も発生し、成功するほど増えていく。推論だけに最適化したチップなら、汎用プロセッサーが抱え込まざるを得ない余分な仕組みを削ぎ落とし、その1つの仕事をより低コストでこなせる。OpenAIの規模でモデルを提供する企業にとって、推論コストを削ることは、採算が成り立つかどうかの分水嶺となる。
コスト計算の裏には、もう1つの動機がある。OpenAIが本当に欲しているもの、すなわち「制御」だ。汎用ハードウェアを借りるということは、誰かが設計し、価格を決め、割り当てを決める部品の上にビジネスを築くことを意味する。設計を所有すれば、この方程式は変わる。シリコンはOpenAI自身のモデルが実際にどう振る舞うかに合わせて形作られ、同社は市場で全量を奪い合うのではなく、自社の供給の一部をコントロールできるようになる。これこそが、最上位のモデルから最下層のプロセッサーまでを貫く垂直統合型スタックがもたらすべき価値である。



