AIがハイブリッドになるとしたら、それはどのようなものなのか?
生成AI(ジェネレーティブAI、つまり新しいデータや情報を生成するAI)は、非常に高い計算量を必要とする。それは、これまでに見たどの技術よりもはるかに多くのデータ、リソース、そして好奇心旺盛で要求が厳しいユーザーを必要とする。そのすべてのデータを、ユーザーが要求する速度で、またユーザーが求める「リアルタイム」や「ほぼリアルタイム」のタイミングで処理することは、クラウドだけでは不可能だ。もしそうするならば、驚くほど高くつくだろう。クアルコムのホワイトペーパーによれば、大規模な言語モデルは訓練に数カ月を要し、莫大な量のデータを迅速に処理する能力を持つ複雑なサーバーハードウェアが必要だと同社は述べている。一方で、モバイルデバイスは、ローカルレベルでより小さな大規模言語モデルの処理を行うことができると彼らは述べる。モバイルデバイスがエッジでより小さく、容易な処理を担当することで、クラウドはより大きく、強力な作業を管理するための余裕を持つことができる。このパートナーシップは時間とエネルギーを節約し、エンドユーザーによりシームレスな体験を提供する。これは、生成AIのワークロードを分散するためのより強力で効率的な方法であり、近い将来、このモデルは成長を続ける可能性が高く、モバイルデバイスもより強力で、より強力で能力のある作業を行うことができるようになると考えられている。
クアルコムはすでにこのアプローチを使用しており、小さなデバイスとクラウドの両方にデプロイ可能な統合AIスタックを構築して、AIを最大限に拡張することを支援している。クアルコムはこの分野でリーダーシップを発揮しつつあるが、私はAIスタック全体に参加する企業が、AIの価値を最大化するためにエッジでより多くの計算と処理を実行する方法について、またAIが完全にスケールするために必要なコストとリソースをより適切に管理する方法について、より多くのことを語ってくれることを期待している。