グーグルのGemini Intelligenceエージェントについて、すでに分かっていること
2026年2月、9to5GoogleはGoogleアプリ17.4ベータ版の中に、「Bonobo」というコードネームの新しいGeminiエージェントを発見した。その1カ月後、グーグルはPixel 10シリーズとサムスンのGalaxy S26限定で画面自動操作ツールを正式に提供開始し、5月12日には最終的にこれを「Gemini Intelligence」と名付けた。この機能は、自動的にスクリーンショットを取得し、人間のユーザーと同じように仮想的なタップやスワイプでユーザーインターフェースを操作する仕組みだ。
今回、アプリのコードをさらに詳しく調べたことで、Gemini Intelligenceがどこへ向かっているのかがより明らかになった。
Gemini Intelligenceの次の展開
コード内に見つかった「agent_schedules」という文字列は、Gemini Intelligenceが要求されたときだけでなく、計画されたスケジュールに従ってタスクを実行できるようになることを強く示している。つまり、このエージェントは未来の特定の日時に実行するタスクを計画できるようになり、反応型ではなく能動型の動作へと進化する可能性が高い。
これは、「配車を予約して」と頼む使い方と、「毎朝、航空券の価格を確認して、値下がりしたら知らせて」と頼む使い方の違いを意味する。重要なのは、スケジュールされたタスクによって、ユーザーがスマートフォンを使っていないときでも、エージェントがユーザーの代わりに働ける点にある。
ソースファイルclasses2.dex内には、次の記述がある。
ROBIN_AGENT_MODE_FG_SERVICE_STARTED
ROBIN_AGENT_MODE_FG_SERVICE_END
ROBIN_AGENT_MODE_FG_SERVICE_FAILURE
コード内の「AGENT_MODE_FG_SERVICE」という文字列は、このエージェントが、経路案内や音楽再生のような他のシステムサービスと同様に、バックグラウンドで継続的に動作するよう設計されていることを示している。
「agent_skills」という文字列は、スキルベースのシステムに向けたコード基盤の存在を示している。これは、AIエージェントだけが使うミニアプリに近い概念で、特定の能力を呼び出せるようになることを示唆している。現段階では、グーグルがこのエージェント向けにどのようなスキルを用意しているのかは分からない。ただし、将来的なアプリ連携をモジュール型のスキルとして追加できる構造はすでに整っている。
Gemini Intelligenceの内部には、補完し合う2つのシステムが存在する。1つは、古いPixelでも動作する音声エージェント「Robin」。もう1つは、画面操作を可能にし、Android 16を必要とする「Bonobo」だ。この2つのサービスの利用可否は別々に判定されるため、Bonoboの条件を満たさない端末でも、更新されたRobin音声エージェントは利用できる可能性がある。


