Positron AIは現在、カスタムチップ「Asimov(アシモフ)」を基盤とする次世代システム「Titan(タイタン)」の開発を進めている。タイタンは1チップ当たり2テラバイトのメモリを搭載し、標準的な空冷ラックで稼働しながら、最大16兆パラメータ規模のモデルをサポートできる。これにより、エンタープライズのデータセンターからソブリンクラウドインフラに至るまで、多様な環境において高スループット推論を実用化することが可能だ。
他社の多くがより限定的な最適化を模索する中、Positron AIはコストと互換性の課題を大規模に解決する、汎用的な推論高速化に取り組んでいる。ただし、その挑戦に臨むのは同社だけではない。
AIスタックの再定義に挑むライバル企業
Positron AIが汎用推論の高速化に挑む中、ライバル企業は異なるアプローチを取っている。Groqは、LLM(大規模言語モデル)向けに超低遅延推論を最適化している。同社のTPU(テンソル・プロセッシング・ユニット)は、一貫性と再現性のあるレイテンシによってサブミリ秒でのレスポンスを可能にし、莫大なクラウドコストを伴わずに即応性の高いAIツールを実現している。これにより、将来的に中小企業でもローカルで応答性の高いAIを導入できるようになるかもしれない。
Cerebras Systemsは、エッジネイティブかつセキュリティ最優先のアプローチを採用している。同社のモジュール型AIアプライアンスは、強力なモデルを完全オンプレミスで稼働させることができ、防衛や重要インフラ、さらにはクラウド利用が制約される業界に最適なソリューションだ。従来は巨大データセンターでしか実現できなかった高度なAI処理を、省リソースで展開可能にした。
Sambanova Systemsは、ハードウェアとソフトウェアを組み合わせた、垂直統合型に最適化されたAIシステムを展開するフルスタック型アプローチを取っている。同社は、企業に学習パイプラインや推論クラスターをゼロから構築させるのではなく、学習済みモデルを搭載したプラットフォームを用意し、専任の機械学習チームを持たない企業向けにAIをアプライアンスとしてパッケージ化して提供している。
これらの企業は皆、巨大データセンターや莫大なクラウド費用を必要としない、高性能な推論の実現を目指しており、新たな市場機会を切り拓いている。


