AI

2025.11.19 14:00

新たなUIとしてのAI、グーグルのGemini 3は「万能ソフトウェア」へさらに近づく

Google

Google

AIの革新者たちは1年以上前から「AIが新たなUI(ユーザーインターフェース)だ」と語ってきた。グーグルが同社史上最も知的だとする新モデル「Gemini 3」を発表したことで、その主張はいっそう明白になった。

Gemini 3は、新しい生成UIモードを取り込み、複雑かつマルチモーダルな問いへの回答を理解するために、固有のUIを自動的に提供する。これは生成型UIにおける大きな前進だ。

グーグルの検索担当エンジニアリング副社長エリザベス・ハモン・リードは「Gemini 3の比類なきマルチモーダル理解と強力なエージェント的コーディング能力は、特注型UIの生成も実現できます。今やAIモードの中のGemini 3は、応答に最適なビジュアルレイアウトをその場で動的に作成し、インタラクティブなツールやシミュレーションを備え、利用者のクエリに合わせて調整できるのです」と述べる。

グーグルによれば、Gemini 3は推論能力を強化し、人間の意図をより深く理解できる。同社の膨大な検索結果のコーパスから関連性の高い回答を見つけ出すのが得意になり、利用者が聞きたいことに迎合するのではなく、最も真実に近いことを伝える傾向が強まっている。

しかし最大の革新は、新たな生成UIである。すなわち、われわれの問いに答えるためにカスタムビルドされたインタラクティブなソフトウェアインターフェースだ。

グーグルが示す一例は「三体問題」の説明だ。Gemini 3は、宇宙空間で三つの天体が軌道運動する場合に一般に不安定へと向かうことを示す、即席の物理デモンストレーションを生成する。別の例としては住宅ローンの返済オプションがある。ここではGemini 3が、返済期間、金利、頭金、物件価格を入力できるインタラクティブな住宅ローン計算機を即座に生成する。

ある意味で、これはAIが万能ソフトウェアに近づいていることを示している。それは、高度なAIモデルが、与えられた要件に対して最適なUIを動的に模倣または創出できる段階を意味している。ChatGPTやClaudeといった主要なLLM(大規模言語モデル)は、われわれが望む結果を言語で指示するため、手づりのUIの相対的な価値を下げがちだ。しかしグーグルのGemini 3は、回答を提示し、プロセス理解を深め、入力の変更に応じて迅速に調整できるよう、その場で有用な新しいUIを発明する能力において、いま最も優れている可能性が高い。

次ページ > AIはコンピューティング史上三番目のUIのパラダイムだ

翻訳=酒匂寛

タグ:

advertisement

ForbesBrandVoice

人気記事