AI

2025.12.11 13:21

AIがもたらす未曾有のネットワーク負荷への対応策

stock.adobe.com

stock.adobe.com

Pavel Bykovは、2016年から自動化されたネットワーク保証の先駆けとなっているIP Fabricの共同創業者兼CEOである。

advertisement

LLM、GPU、NLP、SSDなどの頭字語の氾濫の中で、AIインフラの最も重要な要素の一つを見落としがちだ。それはAIを支えるネットワークである。

20年前、世界中のネットワークはクラウドへの移行を始めた際に、前例のない新たな需要に直面した。当時、私はヨーロッパ最大のIPコールセンターを構築するネットワークエンジニアとして、ネットワークの制御を維持しながら新技術を採用することがいかに困難であるかを経験した。

現在、AIの出現により、この問題が再び頭をもたげているのを感じずにはいられない。過去20年で多くのことが変わったが、IT責任者たちは依然として、ネットワークのセキュリティ、安定性、コストを犠牲にすることなくイノベーションを取り入れる方法を模索している。AIをネットワークに導入する前に考慮すべき点について説明しよう。

advertisement

増加するトラフィックに対応するためにネットワークを刷新する。

AIはインフラを限界まで押し上げ、増大する需要に対応するために電力、冷却、ストレージを消費している。今年のデータセンタートラフィックの30%を占めると予測されるAIは、今後3年以内にクラウドコンピューティングやビッグデータ分析を上回ると予測されている。

従来のスイッチやネットワーク機器の多くは、この絶え間ないトラフィックの流れに対応するように設計されていない。また、GPUがすでにAIプロジェクト予算の40%を消費している中、AIがモデルを継続的にトレーニングするために必要な高帯域幅と低レイテンシに対応する準備もできていない。

AIの可能性を最大限に活用しながら、推論あたりの合理的なコストを維持するために、組織はインフラを最適化するための措置を講じる必要がある。一部の組織は従来のスイッチをAI専用に設計されたものに置き換えている。他の組織はクラウドネットワーキングサービスやNetwork as a Service(NaaS)に投資している。しかし、ネットワークの回復力は一度の投資やアップグレードだけでは実現できない。

AIを実装する前に、ITチームはデータセンター、クラウド、エッジ環境間の接続を継続的にマッピングし文書化するプロセスを確立する必要がある。これらの環境それぞれを、定義されたインターフェースを持つ構成要素と考えよう。特にAIインフラがWANやクラウドにリンクする場所では重要だ。

このようなネットワーク動作のモジュール式理解があれば、チームは需要の増加に応じて、デジタルインフラを不安定にすることなく、容量を拡大したり、ワークロードを分離したり、パスを再設計したりする柔軟性を持つことができる。

ネットワークを信頼できる情報源として活用する。

AIワークロードはシステム間の横方向の接続を増やし、ネットワークのマッピングや管理を困難にする。企業規模では、ITチームがAIによって高まる変更率に対応することは単純に不可能であり、これが人為的ミスによる障害件数の増加に間違いなく寄与している。

ネットワーク自動化はここで役立つが、リスクも伴う。真に回復力のある自動化は自律的であるべきで、つまり行動を起こすためにネットワーク全体を理解する必要がある。ネットワーク動作のコンテキストが欠けていると、解決すべき問題よりも多くの問題を引き起こし、コストのかかるエラーの連鎖につながる可能性がある。

多くのITチームは自動化やAIの燃料としてネットワークドキュメントに頼るが、あまりにも頻繁にドキュメントはネットワークの現実から乖離している。自律型ネットワークを構築するための第一歩は、ネットワーク動作の信頼できる共有ビューを作成することだ。これは、すべてのチームとツールが共有の信頼できる情報源から操作できるように、発見、変更追跡、文書化を日常業務に統合することから始まる。この信頼できる情報源こそが、信頼性の高い自動化されたガバナンスの鍵となる。

古いセキュリティ対策を犠牲にせず、新しいセキュリティ対策を追加する。

AIワークロードは、セグメンテーションや暗号化などの従来のセキュリティ対策が常に対応できるとは限らない新しいイースト・ウェスト(東西)トラフィックパターンを生み出す。これらの対策は単一のデバイスや場所に固定されるのではなく、アプリケーションと共に移動し、ワークロードがデータセンター、クラウド、コンテナ間を移動する際にポリシーを均一に適用すべきだ。

既存の防御を強化した後、ITチームは動的なAIトラフィックが最も露出を生み出す領域を保護するために、マイクロセグメンテーションやIDベースのアクセス制御などのアプリケーション対応技術を重ねて導入する計画も立てるべきだ。

しかし、世界中のすべてのセキュリティ対策も、それらが実際にどのように機能しているかを把握できなければ役に立たない。データセンターとエンドポイントは安全に見えるかもしれないが、ネットワークの中間部分は多くの場合不透明で、監視されていないルーティングパス、非対称フロー、ファイアウォールのバイパス、その他のリスクを隠している。

継続的なセキュリティを確保するために、ITチームはシステム間の依存関係をマッピングし、ボトルネックや単一障害点を特定できる必要がある。すべてのコンポーネントが新旧多数のシステムと相互作用するAI主導の環境では、一貫したガバナンスを確保するためにこのレベルの可視性と制御が不可欠だ。

飛び込む前に慎重に検討する。

AIを導入する圧力は過去最高に達している。しかし、急ぎすぎると多くの場合、近道を取ることになり、コストの増加やリスクの複合化につながる。

深みに飛び込む前に、インフラがどのように連携しているかを理解する時間を取ることが不可欠だ。それは以下を意味する:

1. データセンター、クラウド、エッジサイト全体の依存関係を継続的にマッピングする。

2. すべてのチームとツールがネットワークの同じ理解に基づいて作業できるよう、ネットワークの可視性を一元化する。

3. 既存のプロセスとツールの不足点を評価し、必要に応じて新しいテクノロジーを追加する。

これらのステップに従うことで、AIの増大し続ける需要に耐えられる回復力のあるネットワークを構築するための大きな一歩を踏み出すことになる。

forbes.com 原文

タグ:

advertisement

ForbesBrandVoice

人気記事