また、同社のパフォーマンスリポートによれば、Gemini Proの上位モデルである「Gemini Ultra」は、大規模言語モデル(LLM)の研究開発で広く用いられている32の学術ベンチマークのうち30項目で、「GPT-4」を含む最先端モデルの結果を上回ったとのことだ。
Geminiプラットフォームは、Ultra、Pro、そしてモバイルデバイス用のNanoという3つのサイズで提供される。最大サイズのUltraは、現在「さらなる改良」を行っており、2024年に開発者や企業向けに公開する計画だ。
グーグルはこれまで、OpenAIのChatGPTに後れをとっていると責められてきた(ChatGPTは、人気でも実力でも、生成AIの最高峰と広く見なされている)。同社によれば、Geminiはマルチモーダルとなるようにトレーニングされたという。つまり、テキスト、画像、動画、音声といったさまざまなタイプのメディアを処理できるということだ。
また、同社によると、Gemini Ultraは、MMLU(大規模マルチタスク言語理解)で90.0%というスコアを叩き出し、人間の専門家(89.8%)を上回るパフォーマンスを示した初のモデルだという。MMLUは、数学、物理学、歴史、法律、医学、倫理などの57科目の組み合わせにより、世界にまつわる知識と問題解決能力をテストするものだ。
グーグルは12月13日、Gemini Proの提供を、企業顧客には「Vertex AI」プログラムを通じて、開発者には「AI Studio」を通じて開始した。Proバージョンは、同社のチャットボット・インターフェース「Bard」(英語版)にも搭載されている。