2026.06.01 09:46

デル・テクノロジーズ、エージェント型AI時代のインフラ評価指標を提示

Maribel Lopez | Contributor

著者フォロー

記事を保存

Adobe Stock

ラスベガスで開催されたデル・テクノロジーズ・ワールドで、デル・テクノロジーズ会長兼CEOのマイケル・デル氏は、企業テクノロジーリーダーで埋め尽くされた会場で明確な主張を展開した。組織がインフラを評価する際の指標は進化しているというものだ。

GPU数、クラウド対オンプレミスの比較、モデルベンチマークが議論の中心を占めてきた。マイケル・デル氏の初日基調講演では、インフラ投資判断を実際の成果に結びつけることを目的とした2つの追加指標が紹介された。トークンまでの時間（システムがリクエストを処理し、使用可能なAI出力を返すまでの速度を測定）と、トークンあたりコスト（その出力を大規模に生成する際のコストを測定）である。

「この規模の投資において、最初のトークンまでの時間は極めて重要だ」とデル氏はステージ上で述べ、同社のNVIDIA搭載デルAIファクトリー上で本番AIワークロードを実行している企業顧客が現在5000社に達していることを明らかにした。この数字は、2年前のプログラム開始時から大幅な増加を示している。

NVIDIA創業者兼CEOのジェンスン・フアン氏は、デル氏と並んで登壇し、NVIDIA GTCカンファレンスとデル・テクノロジーズ・ワールドの両方で、これらの指標が新たな緊急性を帯びている理由を説明した。エージェント型AIシステムは、長期間にわたって自律的に推論、計画、タスク実行を行うため、単純なクエリに応答するシステムと比較して100倍から1000倍の計算量を必要とする。「数カ月かかっていたものが数週間に、数週間かかっていたものが数日に、数日かかっていたものが数時間になった」とフアン氏は述べ、エージェント型ワークフローを実行している企業ですでに進行中の生産性変革を説明した。インフラに対する需要への影響は極めて大きい。

OpenAI社長のグレッグ・ブロックマン氏も同日、X.com上で独自にこの枠組みに言及し、「トークンは急速に問題解決のための普遍的なインプットになりつつある」と投稿した。インフラベンダーとモデルプロバイダーが数週間のうちに同じ指標で収束していることは、企業のAI支出の評価方法における広範な変化を示している。

インフラ問題の根底にあるデータ問題

デルの重要なAI製品発表の1つは、デルAIデータプラットフォームにおける新しいデータオーケストレーションエンジンに焦点を当てたもので、同社はこれを企業データと本番対応AIエージェントの間の欠けていたレイヤーと位置づけた。

データオーケストレーションエンジンは、プラットフォームのインテリジェントな制御センターである。数十億の非構造化ファイルをインデックス化し、ガバナンスされたデータパイプラインを構築し、エージェント型ワークフローを実行可能にする速度で、それらを必要とするモデルやエージェントに接続する。デルは、更新されたプラットフォームが従来世代と比較して、ベクトルインデックス化が12倍高速、データクエリが6倍高速、最初のトークンまでの時間が19倍高速になると主張している。これらの主張はまだ検証が必要だが、提案されているパフォーマンスの向上は、AIの拡張を目指す企業にとって朗報である。

エンジンが対処する根本的な問題は、ほとんどの大規模組織がよく知っているものだ。企業は、既存データをAI利用のために準備すると同時に、大規模なAIワークロードをサポートするために必要なデータインフラを再構築している。これら2つの取り組みは、同じリソースとスキルを同時に奪い合っている。

「データがサイロ化されていれば、エージェントは盲目だ」とデル氏は述べた。この発言は、多くの企業AI試験プログラムが本番環境に到達していない理由を正確に説明している。組織の独自データ、内部ナレッジベース、業務システムへのアクセスなしに動作するエージェントは、エージェント型AIを有用にするビジネスコンテキストを提供できない。

デルはまた、Starburstを搭載したデル・データ・アナリティクス・エンジンを通じて、GPU高速化SQLアナリティクスを発表し、NVIDIA Blackwell GPU上で最大6倍高速なクエリパフォーマンスを実現する。すでにStarburst、NVIDIA、デルとのパートナーシップを持つバンク・オブ・アメリカは、この機能を使用すると予想される機関の1つである。

本番環境までの時間を短縮するために構築された広範なエコシステム

デルは、フロンティアモデルパートナーシップの大幅な拡大とともに、新しいデルAIエコシステムプログラムを発表し、両方をインフラ調達から本番AI展開までの時間を短縮するメカニズムと位置づけた。

モデル側では、デルは複数の主要AIプロバイダーをデルAIファクトリーのオンプレミスに導入するコラボレーションを発表した。グーグルとデルは、Dell PowerEdge XE9780サーバー上でGoogle Distributed Cloud経由でGemini 3 Flashモデルを実行するために協力しており、企業がデータレジデンシーと主権要件を満たす機密コンピューティング環境で高度な生成AIワークロードを実行できるようにする。OpenAIのCodexはデルAIデータプラットフォームと接続され、企業が内部コードベース、ドキュメント、ビジネスシステムに対してエージェント型コーディング機能を展開する道を提供する。SpaceXAIのGrokは、オンプレミスまたはハイブリッド企業展開で利用可能である。PalantirのFoundryとAIPプラットフォームは、Dell ObjectScaleとPowerFlex上に展開されたOntologyレイヤーとともにオンプレミスで提供され、組織が自社環境内でデータソースを接続し、ビジネスワークフローを自動化できるようにする。

Hugging Face上のデル・エンタープライズ・ハブは、企業にMiniMax-M2.7、DeepSeek Pro、DeepSeek-V4、GLM 5.1、Kimi K2.6を含む厳選されたオープンウェイトモデルのコレクションへのオンプレミスアクセスを提供し、デルAIファクトリーインフラ向けに最適化されている。

デルAIエコシステムプログラムは、ソフトウェアプロバイダーにデルインフラ上でソリューションを認証するための検証済みパスを提供することで、パートナー関係を正式化する。企業購入者にとって、実用的なメリットは、特定のソフトウェア、サービス、またはモデルの構成を自動化する事前検証済み展開ブループリントであり、歴史的に調達から本番までのタイムラインを延長してきた統合作業を削減する。

エージェントハーネス：企業がまだ問い合わせていない評価基準

基調講演の中でより技術的に実質的な瞬間の1つは、エージェントが実際に本番環境でどのように動作するかについてのフアン氏の説明から生まれた。エージェントは大規模言語モデル上で直接実行されるのではなく、ハーネス上で実行されると彼は説明した。ハーネスは、安全でガバナンスされたサンドボックス内に位置するソフトウェアレイヤーである。ハーネスはエージェントの推論ループを管理し、ツールアクセスを制御し、大規模な外部モデルを呼び出すタイミングと小規模なローカルモデルを使用するタイミングを決定し、マルチステップタスク全体でメモリとコンテキストを処理する。

NVIDIAのオープンソースサンドボックスであるOpenShellは、デスクサイドワークステーションからPowerEdgeデータセンターサーバーまで、デルAIファクトリー全体でサポートされるようになった。デルはまた、マルチエージェントワークフローを展開するためのテスト済み基盤を提供するNVIDIA AIQ i.0ブループリントのサポートも発表した。

AIインフラを評価するCIOにとって、ハーネスアーキテクチャは評価チェックリストへの意味のある追加項目である。エージェントハーネスがどのように展開、ガバナンス、保護されるかを明確に定義していないインフラは、特にエージェントが認証情報を取得し、企業システムにアクセスし、マシン速度で自律的なアクションを実行する場合、重大な運用およびセキュリティギャップを残す。

例えば、「見えないものは保護できず、見えないものは管理できない」とデル氏は述べ、人間ユーザーと同様にエージェントにも直接適用される用語でセキュリティの課題を枠組み化した。アクセスが侵害されたり、権限が誤って設定されたりしたエージェントは、単一の人間ユーザーにはできない方法で、ワークフロー全体にエラーやセキュリティ障害を伝播させる可能性がある。

ハイブリッドAIインフラとエネルギー制約

デルの調査データによると、AIワークロードの67%はすでにパブリッククラウドの外で実行されており、88%の組織が少なくとも1つのAIワークロードをオンプレミスで実行している。同社は、ハイブリッドAIを過渡的な状態ではなく、ほとんどの大企業にとっての長期的なアーキテクチャの現実として位置づけた。

月曜日に発表された新しいデル・パワーラックは、コンピュート、ネットワーキング、ストレージを組み合わせた完全統合型ラックスケールシステムであり、単一ユニットとして設計および検証されている。これは、コンポーネントからAIインフラを組み立てる統合オーバーヘッドを削減しながら、ラックスケールでの熱管理と電力最適化をサポートするように設計されている。

デルはまた、NVIDIA Vera Rubin NVL72プラットフォームの冷却要件を満たすように設計された初のラックマウント冷却分配ユニットであるデル・パワークールCDU C7000を発表し、4Uフォームファクターで220キロワット以上の冷却能力を提供する。NVIDIA Rubin GPUの単一ラックは130キロワット以上の電力を消費する可能性があり、デルは、サステナビリティの考慮事項とは無関係に、エネルギーの利用可能性がAI展開タイムラインに対する現実的な制約になりつつあると指摘した。

大量のオンプレミスワークロードに対して、デルはデル・デスクサイド・エージェンティックAIを発表し、高性能デル・プロ・プレシジョン・ワークステーションとNVIDIA NemoClawを組み合わせた。同社は、この構成により企業がパブリッククラウドAPIコストに対して最短3カ月で損益分岐点に達し、変動トークンコストを固定インフラ投資に転換できると主張している。

企業購入者にとって何が変わるか

デル・テクノロジーズ・ワールド初日の発表は、企業AIインフラの議論を能力からより迅速な実行へと移行させ続けている。核心的な質問は、特定のインフラ構成が本番ワークロードで最初のトークンにどれだけ迅速に到達できるか、トークンあたりどのようなコストで、そしてその上で実行されるエージェントを支えるガバナンスアーキテクチャがどのようなものかである。

これらの質問に答える最良の立場にある組織は、すでにデータアーキテクチャの合理化を開始し、ハイブリッドワークロード配置戦略を定義し、エージェントハーネスがどのように保護およびガバナンスされるかの評価を開始している組織である。インフラはほぼ毎日改善されているが、それを使用するために必要な実行規律は、本番環境に到達するAIプログラムと試験段階にとどまるプログラムを分ける変数であり続けている。

マリベル・ロペス氏は、企業AI、AIインフラ、エージェント型システム、AIガバナンス、AI駆動型カスタマーエクスペリエンスを専門とする市場調査および戦略コンサルティング会社、ロペス・リサーチの創業者兼主席アナリストである。

（forbes.com 原文）