Googleが提供する最先端のGemini AIモデルを使用するこの機能は、2024年5月に開催されたGoogle I/Oで初めてお披露目された。ユーザーは、まるで人間と話しているかのように、幅広いトピックについて質問ができ、途中で会話に割り込むことも可能だ。また、Gemini Liveは、ユーザーとのやり取りから学習し、個々のコミュニケーションスタイルに適応していく。
X(旧Twitter)での発表によると、ユーザーは画面右下のGemini Liveアイコンをタップすることで、即座に「ライブ」状態に入り、Geminiとチャットできる。Gemini Liveは、通常は有料サブスクリプション加入者のみが利用できるGoogleの高度なGemini Pro 1.5 AIモデルを使用している。これにより、無料プランのユーザーも初めてGoogleのプレミアムAIモデルにアクセスできるようになった。
しかし、Gemini Liveでは、GmailやGoogleドキュメントとの統合など、Gemini 1.5 Proで利用できる高度な機能の多くはまだ利用できない。これらの機能を使いたい場合、Google One AI Premiumプランに加入し、通常の「非ライブ」版のGemini Advancedチャットボットを使用する必要がある。それでも、現時点では無料ユーザーが体験するGemini Liveと、フルサブスクリプションを支払っているユーザーとの体験には大きな違いはない。
グーグルがGemini Liveを無料で提供する理由は明確だ。より多くの人々が利用することで、GoogleのAIモデルのトレーニングに必要なデータが蓄積されるからである。音声録音は現在保存されていないが、グーグルは文字起こしされた会話データを将来のAIモデルの改善に利用する。また、匿名化された形ではあるが、会話が人間のレビューを受ける可能性もある。とはいえ、グーグルはユーザーに機密情報を入力しないように注意を促しているが、自然な会話の中でこれを避けるのは難しいかもしれない。Gemini Liveを無料で提供することは、ChatGPTのAdvanced Voice Modeなど、競合サービスに対するプレッシャーにもなるだろう。
発表によると、Gemini Liveは現時点でiOSでは利用できないが、グーグルがiOS向けのGeminiアプリをリリースした後にほどなく利用可能になる見込みだ。英語以外の言語への対応も、同じ時期に開始される予定だという。
(forbes.com 原文)