2026.06.28 15:08

エージェンティックAI時代の到来でQualcommに訪れた好機

Karl Freund | Contributor

著者フォロー

記事を保存

stock.adobe.com

エージェンティックAIについて、そしてそれが私たちの生活やビジネス、さらにはコンピューティングデバイスとの関係にまでどのような影響を及ぼすのかについて、多くの人がさまざまに耳にしてきただろう。本稿では、個人向けデバイス、エッジコンピューティング、そしてハイパースケールのクラウドインフラにまたがるエージェンティックAIインフラの基本的な全体像を整理し、1社のプレーヤーであるQualcommが、エージェンティックAIをまさに待ち望んでいた好機と捉えていることを評価する。（情報開示：Qualcomm、Nvidiaおよび他の多くのAI半導体企業はCambrian-ai Researchのクライアントである。）

エージェンティックAIとは何か

エージェンティックAIとは、要請に応じて出力を生成するだけにとどまらず、目標を設定したり分解したりし、戦略を選択し、目標達成に向けて行動（API、アプリ、ツール、他のエージェント）を実行することで「主体性（agency）」を示すシステムを指す。完全なソリューションでは、1体または複数のAIエージェントをオーケストレーション（統合管理）することがあり、それぞれが異なる自律性の度合いを持つ。

従来型AIや生成AIが反応的であるのに対し、エージェンティックAIは、結果を予測したり質問に答えたりするだけではなく、実際に仕事をこなすことができる。たとえば「ベンダーを調査してRFP（提案依頼書）を下書きしてほしい」とAIエージェントに依頼できる。エージェントは目標をステップに分解し、順序立て、ツールやAPI、ワークフロー、専用コード、あるいは他のエージェントを通じてそれらのステップを実行できる。

エージェンティックAIのコントロールプレーン（制御層）はCPU上で動作し、人間のガイダンスは限定的で足りる。重要なゴールとして、ユーザーが行動を実行するための承認権限を付与できるようになる。エージェンティックAIは生成モデルを、ツール呼び出し、データソースへの問い合わせ、状態更新、タスク完了までの反復を行う広範な制御ループの内部にある「脳」として用いる。

エージェンティックAIがコンピューティングインフラに与える影響

エージェントがより長い時間軸で複数ステップを走らせ、ソリューションの要素のためにループ内で1つまたは複数のAIモデルを呼び出すようになると、エージェンティックAIは生成AIよりはるかに多くのトークンを消費し、より低いレイテンシを要求する。その結果、エージェンティックAIを動かすインフラは、コストと価値のバランスを取るために、より効率的にならなければならない。

エージェンティックAIシステムが低レイテンシを求めるのは、フィードバックループで動作し、タスクあたり多数のツール呼び出しとモデル呼び出しをオーケストレーションし、しばしばリアルタイムで行動するからだ。ステップごとのわずかな遅延でも積み重なれば、許容できないエンドツーエンドの遅延や不安定な挙動につながる。

従来の生成AIアプリは「1回のリクエスト→1回の応答」であることが多く、数秒の待ち時間は許容される。だがエージェンティックなシステムは、計画し、行動し、観測し、再計画することを複数回反復するため、ステップごとに1〜2秒遅れるだけで、全体として数十秒、あるいはそれ以上に簡単に膨らむ。さらに、単一のユーザー意図が、数十回の検索、RAG（検索拡張生成）呼び出し、API／ツールの呼び出し、エージェント間メッセージを引き起こし得る。追加されるホップのたびにネットワークと計算のレイテンシが上乗せされ、それは線形に、あるいはそれ以上に累積する。

カスタマーサポート、音声ボット、コパイロット型インターフェースでは、ユーザーはほぼ瞬時のターンテイキングを期待する。1回のアクションに15〜30秒かかるエージェントは、精度にかかわらず壊れていると受け止められる。トレーディング、物流制御、自律システムといった領域では、意思決定は厳しい時間予算内に収めなければならず、レイテンシの増加は機会損失や安全性を損なう挙動へ直結する。

業界は個々のAIモデルの最適化から、複雑で分散したAIシステムをオーケストレーションする方向へシフトしており、このシフトがエッジ、クラウドエッジ、データセンターにまたがるコンピュートアーキテクチャを再定義しつつある。

エージェンティックAIでCPUが再び脚光を浴びる

AI向けインフラは当初、高スループットのGPUトレーニング向けに最適化され、その後は推論向けに最適化されてきた。CPUはコントロールプレーンとして機能し、重い処理をGPUや他のASICへ送ってきた。推論処理はかつて、ニューラルネットワークを1回だけ通過する単純なものと考えられていた。エージェンティックAIはこのモデルを完全に覆し、新たなアーキテクチャが登場しつつある。

エージェンティックAIはワークフロー駆動型であり、問題に対する最適な答えを見つけるための最適化ループにおいて、計画、スケジューリング、最適化をCPUに大きく依存する。その結果、CPUは補助的な役割から、オーケストレーションエンジンおよび意思決定を担うエージェンティックな役割へと移行する。オーケストレーションは複数のツールとAIモデルのインスタンスにまたがって行われるため、アクセラレータ側のワークロードも増加する。

エージェンティックなワークロードは、CPU側のコントロールプレーンのロジックを大幅に重くする。具体的には、計画、複数ステップのツール呼び出し、検索のオーケストレーション、メモリ／コンテキスト管理、API呼び出し、評価、マルチエージェントの協調、タスク終了である。「AIエージェント時代」のデータセンターでは、アクセラレータ容量1GWあたりに必要なCPUコア需要が約4倍に増え得るため、大規模なエージェンティックサービスではほぼ同等の比率への移行が進んでいる。

「従来型」LLMアシスタントでは、多くの事業者がおおむね「アクセラレータ4〜8基あたりCPUソケット1基」でサイジングしてきた。新たに登場するエージェンティックAIのワークロードでは、ガイダンスや初期導入の状況が、システムレベルで「アクセラレータ1基あたりCPU1〜2基」へとより近づいている。

CPUへの依存が高まるこのシフトに加え、エネルギー効率への注目が増していることが、QualcommがエージェンティックAIに大きな機会を見いだす理由である。ただし、同社は迅速に動かなければならない。

ハイブリッドAIインフラ：エージェンティックAIワークロードのためのスケーラブルモデル

エージェンティックAIのユーザーが利用できる計算資源の連続体を考えれば、各レイヤーがオーケストレーションされたワークフローに貢献し、それぞれが論理的な役割を果たすことで、インフラは全体として効率を高められることは明らかだろう。適切に実装されれば、ハイブリッドインフラはトークンあたりのコストとエネルギー消費を下げ、それによってエージェンティックなアクションのコストを引き下げつつ、応答性、信頼性、拡張性をより高い水準で提供できるはずだ。これは特にデータセンターにおいて、社会にとって受容可能で、かつ手頃なものとするために、消費電力に鋭く焦点を合わせて達成する必要がある。ここでは、インフラの3つのレイヤー、すなわちエンドポイント、エッジサーバー、ハイパースケールのデータセンターの役割と限界を見ていこう。

モバイルエンドポイント、すなわちデバイスは、意図分類、つまりワークフローのフロントエンドを担う。ユーザーの目的と優先順位は何か。携帯電話は、エージェントがリクエストを解釈し、関連性の高い結果を届けるうえで鍵となる、個人のコンテキスト／状況認識を提供できる。ここではワットあたり性能が最重要だ。エージェンティックAIを動かすために余分なバッテリーを持ち歩こうとする人はいない。日常的に使うデバイスに組み込まれていなければならない。

エッジ、たとえばエッジクラウド、ワークステーション、あるいは車両では、電力を容易に確保できるため、より多くの計算、より多くのセンサー、より多くのメモリ、より多くのストレージが可能になる。これにより、エッジは中間的な推論と集約を実行できる。Qualcommはすでにインテリジェント自動車市場でリーダーの地位を獲得している。

もちろんデータセンターでは、大規模モデルの実行に向けてほぼ無尽蔵の計算を期待する。しかし巨大データセンターは政治的な火種となりつつあり、人口の一部をAIへの反発へと向かわせている。したがって、現状よりも電力効率の高い設計への需要が容易に生まれると結論づけるのは妥当だろう。

このエージェンティックな地平を見渡すと、Qualcommは電力効率の高いCPUとAIで明確に強みを持つ一方、あらゆるアクションが起きている場所であるデータセンターでは出遅れている。

エージェンティックAI時代にQualcommはどう戦うか

データセンターの消費電力とコストへの懸念が高まる中、6月24日に予定される次回の投資家向け説明会で明かされると見込まれるデータセンター戦略について、Qualcommへの関心は大きい。自動車のようなモバイルおよびエッジデバイスでの強みは、同社がエージェンティックAIインフラのフルスケール提供者へと押し上げるための発射台となるのは明らかだ。多くの投資家は、Qualcomm Snapdragonがエッジで優れたAI性能を持つことをすでに知っている。しかしデータセンターで強力な一手がなければ、同社がNvidiaのような規模でエージェンティックAIを活用することは不可能だ。

Qualcommは、最近DragonflyへとリブランドされたCloud AI200をどのように位置づけるのか。推論処理における電力効率のストーリーは十分に強く、Qualcommがデータセンター参入で出遅れた事実を補えるのか。

Dragonflyについて現時点で分かっていること

Qualcommの今後のデータセンター製品（Qualcomm AI200とQualcomm AI250）は、新ブランド「Qualcomm Dragonfly」の下で、トレーニングマシンではなく、効率性重視のAI推論プラットフォームとして位置づけられている。Qualcommは、低い消費電力で10倍超の実効メモリ帯域を実現する革新的なニアメモリコンピューティングアーキテクチャを採用しているとし、それをデータセンターAI推論における「ドルあたり・ワットあたり性能の高さ」と結びつけている。昨今のAIを見ている人であれば、AI計算の戦いが、性能を高めつつデータ移動に費やすエネルギーを減らすための新しいメモリアーキテクチャの戦いへシフトしていることを理解しているはずだ。

Qualcommの発表資料によれば、AI250はラックスケールのAI推論向けに設計され、メモリ効率と消費電力の低減において「世代を超えた飛躍」を実現するという。またAI250はダイレクト液冷を採用するとしており、これはピーク時の瞬間的性能ではなく、ラックスケールでの持続的な効率を狙っていることを示唆する。Qualcommは明確に、低消費電力、より高い利用率、総所有コスト（TCO）の低減を目指している。Qualcommは以前、データセンターのロードマップでNVLinkを採用する意向を発表していたが、この第1世代にネットワーキング技術が含まれるかどうかは分からない。

ターゲット市場：Dragonflyは3つの主要な製品群、すなわちCPU（中央処理装置）、カスタムASIC（特定用途向け集積回路）、専用AI推論アクセラレータを包含する。
カスタムシリコン：同ブランドは、QualcommによるAlphawave Semi買収で得た、インターコネクトの知的財産および高速データ転送技術（PCIe、CXL、Ethernetなど）に依拠している。
ハイパースケーラーとの提携：Qualcommはクラウドプロバイダーやエンタープライズ顧客と緊密に協業しており、ByteDanceのような企業と早期の量産設計が進んでいるとの噂もある（Qualcommは未確認）。大量生産は数十億ドル規模の収益を生むと見込まれている。
フォームファクター：Dragonflyは、単体のアクセラレータカードから高密度サーバー、産業規模のサーバーラックに至るまで、複数の構成で処理ハードウェアを提供する。

Qualcomm投資家向け説明会でさらなる詳細が明らかに

AIの次の時代は、すでに到来している。エージェンティックAIはあらゆる業界の仕事を変革し、人間の働き手が、創造性、価値観、世界についての知識が最も必要とされる領域に、より多くの時間と注意を向けられるようにする。だがエージェンティックAIを手頃な現実にするには、ハイブリッドインフラ全体で、電力効率が高く、かつ高性能な技術を用いて実装しなければならない。Qualcommはデバイスとエッジで、CPUに関する強いストーリーをすでに持っている。今後、同社が広範なAIインフラ提供者へと転身するための転換を完遂できるかどうかが注目される。

（forbes.com 原文）