Veraの正体
そのチップはVeraと呼ばれ、エヌビディアはその用途について率直に語っている。フアンはこれを「エージェント時代のためのCPU」と表現した。同社は、基調講演で発表されたマルチラック型システム「Vera Rubin」プラットフォーム内でVeraの量産体制に入った。
SiliconANGLEによると、1台のVera Rubin NVL72ラックには、72基のRubin GPUと36基のVera CPUが搭載され、NVLinkで接続されている。 TradingKeyによると、Veraは88コアのArmベース設計で、エヌビディアは対象タスクをx86 CPUの約1.8倍の速度で完了すると主張している。さらにVeraは、同社が販売する初のスタンドアロン型データセンター向けプロセッサーでもある。ソウル経済新聞によると、ある試算で約2000億ドル(約32兆円。1ドル=160円換算)規模の市場を狙っている。
これがなぜ重要なのかを理解するには、AIサーバーにおけるCPUの役割を見る必要がある。重い計算を処理するのはGPUだ。CPUはそのGPUにデータを供給し、処理をスケジューリングし、高価なアクセラレーターが遊休状態に陥らないようにする。長年、このホスト用CPUソケットにはインテルのCPU「Xeon」かAMDのCPU「EPYC」が収まっており、良質なビジネスだった。
(編注:ソケットとは本来、マザーボード上にCPUを装着する物理的な差し込み口を指す。本稿ではそこから転じて、サーバー1台ごとに必ず1個または複数個のCPUが収まる枠、顧客が外部から調達するほかなかった採用領域を象徴する単語として用いられている)
データセンター用プロセッサーは高価格・高利益率で、その収益が次世代設計の資金源となる。DCDとYahoo Financeによると、前四半期、AMDはデータセンター部門から過去最高の58億ドル(約9280億円)、インテルはデータセンター・AI部門から51億ドル(約8160億円)を計上した。
Veraが狙うソケット
Veraはまさにそのソケットを奪うために作られている。エヌビディアはラック全体を所有しているため、自社CPUと自社GPUをNVLinkで直結可能なため、低速なPCIeバス経由で接続された標準的なx86ホストでは実現できない、コヒーレントメモリーリンク(一貫性のあるメモリー接続)を構築できる。ホストCPUは、顧客がオープンマーケットで選んで購入する部品ではなくなり、エヌビディアのシステムの一部となる。売り文句は「Veraがわずかに優れたCPUである」ことではない。「CPUはもはや別途購入すべきものではない」という点にある。
最も要求の厳しい顧客は、すでに統合型の道を選んでいる。The Next Webによると、OpenAI、Anthropic(アンソロピック)、SpaceXが最初にVeraチップを採用し、最初のユニットは5月に手渡しで納品された。これら企業は地球上で最大規模のトレーニングおよび推論クラスターを構築している顧客であり、より安価な部品で組み立てられるマルチベンダー型サーバーではなく、統合アーキテクチャを選択している。これは予測ではなく、サプライヤーと顧客の実際の行動であり、重く受け止めるべき種類の証拠だだ。


