GTC 2026で発表された「NVIDIA Groq 3 LPX」は、GPUとLPUの役割分担を実現
3月16日に開催されたエヌビディアの年次開発者会議で、フアンは2026年を「AIの推論の年」と位置づけた。これはAIがいまや学習段階を脱し、「実際に活用する段階」に移行したことを意味する。
フアンはその場で、Groqの専用チップであるLPU(推論処理を極めて高速に実行できることで知られる)と、エヌビディアの「Vera Rubin」世代の最新GPUアーキテクチャを統合する新製品を発表した。ここでのポイントは明確だ。「あらゆる処理をGPUで担う」という従来の前提は、学習性能の優位性を誇れるかどうかよりも、「実際の運用でどれだけ安く、速く、大量に処理できるか」を重視する市場のニーズと合わなくなり始めている。
GPU中心のエヌビディアが、GPUだけでは足りない場合があると事実上認めた格好
GPU中心の象徴ともいえるエヌビディア自身が、学習性能の優位性よりもコストやレイテンシー、そして大規模運用におけるスループットを重視する流れを踏まえ、「必ずしもGPUである必要はない場合もある」という異端の考えを事実上認めた格好だ。
これらのチップはすでに「本格量産」に入っており、この夏から出荷が始まる予定だ。エヌビディアはGroq製チップの生産数量について明らかにしていないが、その規模は相当大きいとみられる。「エヌビディア規模の量産だと言っておこう。これは試験導入ではない」とロスは語った。
ロスによれば、すでに「数多くの」顧客との打ち合わせを重ねているが、現時点で具体的な購入企業は公表されていない。エヌビディアで高性能コンピューティングおよびAIインフラを担当するシニアディレクターのディオン・ハリスは、「現時点で注文を確認できるかどうかは分からない。まだ初期段階だが、関心は非常に高い」と述べている。
他の推論チップ企業の幹部も、エヌビディアとGroqの取引がAI推論市場の確信を強めると評価
たとえGroqとエヌビディアの提携が流通面で一歩リードしているように見えるとしても、他の推論チップ企業の幹部によれば、この取引はAI推論チップに対する市場の確信を強めるものとなっている。
エッジAI向け推論チップを手がけるfemtoAIのCEO、サム・フォクは、新製品「NVIDIA Groq 3 LPX」について、「GPUだけでは、より速い成長が見込まれる推論市場に十分対応できないことを認めたものだ」と指摘する。彼は、より安価で利用しやすい推論手段が普及すれば、需要はさらに拡大すると見ている。
d-Matrixの共同創業者でCEOのシド・シェスは、「フアンは、私たちが以前から主張してきた市場の方向性を裏付けた」と述べ、「エヌビディアの次の成長フェーズは推論から生まれるだろう」と語る。Groqの競合のCerebrasもこの2カ月でOpenAIやAmazonとの提携を発表している。TenstorrentのCEO、ジム・ケラーは、「Groqは異種コンピューティングへの扉を開いた。誰かがしっかりと計算した上での判断だろう」と話す。
こうした流れは好ましいものではあるが、実のところこの取引は成立しない可能性もあった。エヌビディアの戦略は、エコシステムにとって不可欠なプラットフォームになることにあり、推論チップはその最新の追加要素だ。この分野は、「有望なアイデア」から「エヌビディアが支える領域」へと移行しつつある。


