海外

2025.08.27 10:30

高騰するAI運用コストを削減、脱エヌビディア依存で「AIの民主化」に挑む新興勢力

Shutterstock.com

推論は「新たな電気代」

AI経済において、推論はまさに電気代のようなものだ。事業の拡大に伴って増加し、継続的に発生し続ける。メールの自動生成から顧客サポート用チャットボットの運用に至るまで、推論はビジネスを稼働させる「灯り」の役割を担っている。そして現在、その灯りを支えているのは、エヌビディア製の高額なGPUだ。

advertisement

「エヌビディア製GPUは、現在のAIインフラを支えるバックボーンであり、主要クラウドプロバイダーにおける推論ワークロードのほぼすべてを担っている。問題なのは、時価総額約4兆ドル(約589兆円)の巨大企業が市場を独占していることに加え、GPU自体が効率性を前提に設計されていない点にある。GPUは柔軟性を重視し、幅広いタスクに対応できる汎用チップとして複雑なモデルのトレーニングに最適化されている。それにも関わらず、推論の大半は依然としてエヌビディアのハードウェア上で実行されている。その結果として業界は莫大な電力消費、割高なクラウド料金、そして小規模プレーヤーにとっての選択肢の制約という課題に直面している。こうした状況を打開するため、Positron AIは最もエネルギー効率に優れた推論専用チップの開発に取り組んでいる」と、同社CEOのミテシュ・アグラウルは語る。

Positron AI、Groq、Cerebras Systems、Sambanova Systemsなどの新興勢力は、「エヌビディア税」とも言える現状を打破すべく、代替製品の開発に挑んでいる。各社が共通して掲げるのは、エネルギー消費の大幅削減、コストパフォーマンスの向上、そして開発者により大きな裁量を与える推論インフラの提供だ。その中でも、Positron AIは技術的に最も野心的であり、商業的にも最も成熟したプレーヤーだと言える。

システムエンジニアのトーマス・ソーマーズとコンパイラの専門家エドワード・ケメットによって設立されたPositron AIは、競合とは一線を画す戦略を打ち出している。同社は、アプリケーション専用チップや汎用GPUの開発ではなく、メモリ効率を最適化した再構成可能チップであるFPGA(フィールド・プログラマブル・ゲート・アレイ)に注力している。そして、このFPGAを基盤にパフォーマンスとエネルギー効率を最優先に設計された推論特化システム「Atlas」を開発した。

advertisement

Atlasのメモリ帯域幅利用率は93%以上と、GPUの約30%を大きく上回る。さらに、エネルギー消費を66%削減し、1 ドル当たりのパフォーマンスを3.5倍向上させながら、コード変更を必要としないシームレスな実装を実現している。この即時性の高い互換性により、インフラをゼロから書き換えることなく、既存のクラウドやオンプレミス環境からの移行を容易にしている。こうした優位性により、Positron AIはCloudflare(クラウドフレア)やCrusoe(クルーソー)、Parasail(パラセイル)などの大手企業を顧客に獲得した。

同社は最近、シリーズAラウンドで5160万ドル(約76億円)を調達した。リード投資家を務めたのは、スペースXやテスラ、X、xAIといった世界最大規模のAIハードウェア購入企業を支援してきたヴァラー・エクイティ・パートナーズ、アトレイドス、DFJグロースだ。

次ページ > AI推論を変革するスタートアップたち

編集=朝香実

タグ:

advertisement

ForbesBrandVoice

人気記事