しかし、OpenAIの「GPT-4o」などのAIモデルがジョークを言ったり歌を歌ったりするような高度なタスクを実行するためには、より高速で効率的なネットワークインフラが必要になる。それを提供しているスタートアップの1つが、設立から3年の「LiveKit」だ。
「OpenAIが脳を作っているとすれば、我々は脳と体の伝達を可能にする神経系を構築している」とLiveKitの共同創業者でCEOのRuss D'Sa(ラス・ドゥサ)は話す。
2023年11月頃までは、投資家たちはマルチモーダルモデルAIの完成までに少なくとも5年はかかると考えており、ドゥサは資金調達に苦労したという。しかし、その数カ月後にグーグルとOpenAIが、オーディオとビジュアルのフォーマットでコンテンツを処理・生成できる新しいAIモデルをリリースすると、環境は大きく変わった。「以前出資を断られた投資家から電話がかかってきて、ラウンドの進捗状況を尋ねられた」と彼は言う。
LiveKitは6月4日、Altimeter Capitalが主導し、Redpoint Venturesが参加したシリーズAラウンドで2270万ドル(約35億5000万円)を調達したと発表した。このラウンドには、グーグルのチーフサイエンティストであるジェフ・ディーンや、テック業界に特化した投資家のエラッド・ギル、PerplexityのCEOであるアラビンド・スリニヴァス、PikaのCEOのデミ・グオ、ElevenLabsのCEOのマティ・スタニゼウスキーといった著名なAIスタートアップの創業者を含むAI業界のエンジェル投資家が参加した。
LiveKitの累計調達額は3800万ドルとなった。情報筋によると、このラウンドでの同社の評価額は1億1000万ドルに達したという。
LiveKitが提供するツールは、OpenAIやCharacter AI、スポティファイ、メタをはじめとする企業の開発者約2万人に利用されており、昨年の売上高は300万ドルに達した。
「マルチモーダル」に最適化
ドゥサによると、多くの開発者が同社のサービスを利用している理由は、現在のインターネットインフラがAIモデルとマルチモーダルなデータをやり取りするのに最適化されていないからだという。現状では、AIモデルに情報やリクエストを送信するたびに、送信者はデータのパケットが受信されたことを確認・承認しなければ次のデータを送信できない。こうした手順は、伝送中にデータが失われないようにするために行われる。これによって発生するタイムラグは、テキストの場合はほとんど気にならない程度だ。しかし、ビデオやオーディオといった帯域幅の広いデータでは、データが転送されるたびに通知を送信し、スムーズな動作を確保するには時間が十分にない。