Computer Useは安全か?
AIモデルがデバイスを完全に制御するという可能性は、当然ながらかなり恐ろしい。だが、ユーザーの「絶対に嫌だ」という最初の反応を乗り越えるために、グーグルはいくつかの安全対策を施している。
第1に、そして最も明白なのは、グーグルがこの機能を一般消費者に解放していない点だ。Computer Useは、開発者およびエンタープライズ環境を明確に対象としている。例えば、新しいユーザーインターフェースのテスト、複数のウェブサイトやアプリにまたがる調査、レガシーソフトへのデータ入力の自動化といったタスクを自動化する必要がある環境だ。
アクセスはGemini APIまたはGemini Enterprise Agent Platformに限定されており、消費者向けGeminiアプリから誤って有効化されたり、誤って起動する可能性は排除されている。Computer Useは、あくまで開発者の手の内にとどまる。
ミスの責任は依然としてあなたにある
安全機能は、以前の独立型モデルから強化されている。Gemini 2.5 Computer Useと同様に、Gemini 3.5 Flashは、明示的に定義された「センシティブな操作」(金融取引など)について必ず人間が承認する「ヒューマン・イン・ザ・ループ」の仕組みを備えている。
ただし、このアップデートでは新たに2つの安全策が追加された。
・「間接プロンプトインジェクション」のような攻撃ベクトルを自動検知。ウェブページ内に悪意あるテキストのプロンプトが隠されていることが判明した場合は実行を停止する
・センシティブまたは取り消し不能な行為を実行しようとする際、明示的なユーザー確認を求める要件を追加する
なおグーグルは、これらの最も重要な安全策がいずれも任意であることを認めている。それらを使うかどうかは開発者の責任であり、問題が起きた場合のリスクもすべて開発者が負うことになる。
Gemini AIユーザーに何が起きようとしているのか?
総じて、GeminiへのComputer Useのネイティブ統合は、従来モデルに対して大きなアップグレードとなっている。主力のGemini 3.5 Flashモデルの一部であるため、computer useを有効にするための追加料金といったものはかからない。新しいモデルは、100万入力トークンあたりの料金がGemini 2.5よりわずかに高い(1.50ドル対1.25ドル)一方で、長期的にコストを大きく抑えられるコンテキストキャッシュ機能も利用できる。
反復作業に追われる多くの開発者にとって、その恩恵は、トークンあたりの価格がわずかに上がる分を十分に上回るはずだ。


