「競争はすでに始まっている」と語るのは、フォーブスがミダスリストに選出した投資家のKindred Venturesの創業者、スティーブ・ジャンだ。「この分野のスタートアップは、より高精度なシステムを構築し、人間らしいリアルな声や会話、そして私たちが求めるデータやアクションへのアクセスを提供することで、既存のプラットフォームと競争することになる」と彼は語る。
ハイテク大手の音声アシスタントは、このAIの急激な進化のスタートに最適な立場にある。グーグルは、旗艦モデルのGeminiで音声検索を強化しており、アップルはChatGPTをSiriのクエリに活用するためにOpenAIと提携した。さらにアマゾンは、Claudeチャットボットを開発するAnthropicにここ1年で80億ドルを投資している。
音声AIによるイノベーション
Kindred Venturesのジャンは、真のイノベーションは、音声AIモデルで達成されると考えている。音声AIモデルは、ChatGPTのようなサービスを支える大規模言語モデル(LLM)とは異なり、実際の音声データをもとにトレーニングされており、抑揚や感情のニュアンスなど、話し方の微妙な違いを捉えることができる。ジャンの投資先であるスタートアップのPlay.aiは音声エージェントに特化した企業で、ElevenLabs(イレブンラボ)やOpenAI、グーグルらを競合に見据えている。しかし、その一方でエージェントが音声アシスタントを飛躍的に改善するとは限らないと考える者もいる。コーディング向けのエージェントを構築するImbue(インビュー)の共同創業者のカンジン・チウは、これらのプロダクトにAIを追加してもわずかな改善にとどまり、新たなAI機能が人々に信頼されるほどの大きな進歩にはならないだろうと指摘した。