2026.05.11 11:00

グーグルのカスタムAIチップ戦略が、エヌビディアの牙城を崩せない理由

Jon Markman | Contributor

著者フォロー

記事を保存

Tada Images - stock.adobe.com

グーグルはエヌビディアに勝つため、独自AIチップを開発している。だが、グーグルの40億ドル（約6280億円）規模のAIチップ戦略は、本当のボトルネックを見誤っている

米国時間４月19日、The Informationは、グーグルがMarvell Technology（マーベル・テクノロジー）と2種類の新しいカスタムAIチップを共同開発するため、最終段階の協議に入っていると報じた（編注：Google Cloud Next 2026で発表された、ブロードコムTPU 8t、メディアテックTPU 8iとは異なる）。1つは、グーグルの既存のテンソル・プロセッシング・ユニット（TPU）と組み合わせるメモリー処理ユニットである。もう1つは、AI推論に特化したまったく新しいTPUだ。推論とは、AIモデルが質問に答えるたびに行うリアルタイム処理のことで、そのモデルを最初に作り上げる大規模な学習処理とは異なる。

マーベルとの契約が成立すれば、グーグルのカスタム半導体の供給網には、ブロードコム（Broadcom）、メディアテック（MediaTek）、マーベル、そしてグーグル社内チームという4つの設計パートナーが関わることになる。グーグルは現在、TPUの出荷台数が2026年に430万個、2028年には3500万個に達すると見込んでいる。TrendForceの予測では、カスタムAIチップの売上高は2026年に45％増加する。一方、標準的なGPUの伸びは16％にとどまる見通しだ。グーグルは、クラウド事業者に金銭的な保証を提示し、本番運用のAI処理でTPUを標準採用してもらおうとしている。また、開発者がエヌビディアの開発環境から移行しやすくするため、TorchTPUという新しいソフトウェア層も投入する。

多くの報道は、これをグーグルがエヌビディアを本気で意識し始めた事象として描いている。その見方が間違っているわけではない。ただし、測るべき戦いを取り違えている。

本当に重要な戦いは、台湾にある1社の内部で起きている。グーグルもエヌビディアもその会社を支配しておらず、どちらにも代替できない会社である。

推論とは何か、そしてなぜ今重要なのか

「学習」とは、モデルが知識やパターンを身につける段階だ。巨大なGPUクラスターが、何カ月にもわたって何十億ものデータ項目を処理する。費用が高く、計算負荷も大きい。2022年から2025年にかけて、AI支出の大半はこの学習に向かっていた。

そして「推論」とは、モデルの学習が終わった後に行われる処理だ。誰かがChatGPTに質問するたびに、Claudeがコードを1行書くたびに、企業の社内AIエージェントが文書を検索するたびに、推論が行われている。1回ごとの処理は小さい。しかし、それを何十億人もの利用者と数百社の企業に掛け合わせると、推論のコストは、これまで学習にかかったコストを上回り始める。

これこそが、半導体業界が方向転換している理由だ。学習用チップは、純粋な処理能力を重視して作られてきた。一方、推論用チップに必要なのは、1回の問い合わせあたりのコスト、速度、効率である。推論で勝つ企業は、必ずしも最速のチップを持つ企業ではない。100万トークンあたりの推論コストを最も低くできる企業となる。これは、まったく別の工学上の課題だ。

グーグルはこの点を明確に見ている。マーベルとの案件は、まさにこの課題を狙っている。共同開発中のメモリー処理ユニットは、既存のTPUで推論を遅くしているメモリー帯域のボトルネックを解消するためのものだ。新しい推論専用TPUは、この用途に合わせて一から設計し直されている。メディアテックが担当するZebrafish（ゼブラフィッシュ）というコードネームのチップは、推論1回あたりの処理コストを30％削減することを目標にしている。戦略全体には一貫性があり、技術面でも本格的である。

だが、チップを実際に製造できなければ、そうした努力は意味を持たない。

次ページ＞すべてを成り立たせている1つの建物