Ankur Shah氏はStraikerの共同創業者兼CEOである。
ウェブの各時代は、人間が情報を作成、消費、活用する方法を変革してきた。Web 1.0での静的ページの閲覧から、Web 2.0での接続や交流の方法の発見、そしてWeb 3.0でのデジタル体験への知性と分散化の導入まで。
私はキャリアを通じて、これらの変革点—eコマースの台頭からSaaSやクラウドコンピューティングの出現まで—において構築に携わってきた。
現在、Web 4.0に入るにつれて、パラダイムはインテリジェントシステムから自律型システムへとシフトしているようだ。そこではコンテンツがますますAIエージェントによって作成、消費、活用されるようになっている。しかし、これまでの各シフトと同様に、サイバーセキュリティに関する新たな疑問が生じている。ブラウザやデジタルツールがより自律的になるほど、それらがもたらすリスクも大きくなる。
過去の変革における私の経験に基づき、エージェント型ブラウザが、Omdiaの調査によればすでに業務日の85%がブラウザ上で費やされている世界で、知識労働をどのように再形成するかについて共有したい。
また、AIセキュリティに焦点を当てた企業の現CEOとして、企業システムがより自律的になるにつれて、この新時代が企業システムの保護にとって何を意味するのかについても説明する。
エージェント型ブラウザの台頭
エージェント型ブラウザとは、人間の継続的な入力なしにウェブサイトをナビゲートし、タスクを実行し、意思決定を行うことができるAI搭載ブラウザである。これらは、ブラウザを受動的なウィンドウから、タブ、ツール、データソース全体で意図を解釈し作業を完了する能動的なオペレーターへと変える可能性を持っている。
単にコンテンツを表示するだけの今日のブラウザとは異なり、エージェント型ブラウザはコンテキストを解釈し、システム間を接続し、自律的にアクションを実行できる。これらは、ユーザーの意図とタスクの実行の間のギャップを埋め、生産性やコラボレーションツールにアクセスし、ウェブや企業システム全体から情報を取得・要約し、メッセージを作成し、取引をスケジュールできる統合AIエージェントを活用している。
初期のエージェント型ブラウザはすでにその可能性を示している。PerplexityのCometはメールに接続してインボックスを検索し、ブリーフィングを提供し、メールの送信/スケジュールを行う。OpenAIのChatGPT Atlasは、ユーザーがブラウジング中に調査やショッピングなどの複数ステップのタスクを実行できる。GoogleはChromeにGeminiを導入し、ページの明確化、タブ間での作業、ブラウジング体験内でのエージェント型タスク実行を可能にしている。
生産性から自律性へ
ブラウザが現代の仕事のオペレーティングシステムになるにつれて、エージェント型ブラウザはこのシフトを増幅させるだろう。これらは力の乗数として機能し、複数ステップのワークフローを自動的に実行する:
• カレンダーやメールの項目に対するアクション。エージェント型ブラウザは、十分なコンテキストや指示があれば、代わりにイベントやメールを送信・スケジュールできる。
• 複数の記録システム間でデータを調整して意思決定を行う。例えば、Zapierのエージェントは8,000以上のアプリにわたってアクションを調整できる。
• レポートやステータスアップデートの生成。ChromeのGemini機能は、ページやオープンタブから要点を要約・抽出する。
企業にとって、潜在的な影響は大きい。エージェント型ブラウザは、大規模なプロセス再設計を必要とせずに、サイクルタイムを効率化し、反復的なタスクを削減し、知識労働者やITチームのための新たな生産性の機会を創出できる。
エージェント時代の企業セキュリティ
しかし、自律性の向上に伴い、エージェント型ブラウザは新たなセキュリティ課題ももたらす。従来のブラウザやエンドポイントセキュリティモデルは、システム全体で行動できるAI搭載エージェントを処理するように設計されていないため、セキュリティチームはアプリケーション層を超えて移行する必要がある。
対処すべき企業リスクの新たなカテゴリーをいくつか紹介する:
1. 設計上のデータ流出:ページやドキュメント内の指示の密輸は、ユーザーのクリックなしにファイルを漏洩させたり、高権限のアクションを実行するようエージェントを強制できる。例えば、私の会社の研究者たちは最近、メールを介したゼロクリックのDrive漏洩を発見した。OWASPもインジェクションと安全でない出力処理を主要な大規模言語モデルリスクとして特定している(ダウンロードが必要)。
2. 自律型マルウェアの展開:MITRE ATLASの研究が実証しているように、AIシステムに対する敵対的技術はすでにいくつか存在する。例えば、システムアクセスを持つエージェントが騙された場合、機械速度でペイロードを取得したり、設定を変更したり、スクリプトを拡散したりする可能性がある。
3. 安全性と評判リスク:コンテキストを誤解釈するAIエージェントは、未承認の通信を送信したり、機密情報を露出させたり、評判や規制上の問題を引き起こす決定をする可能性がある。これらの自律的行動は、責任の追跡や、イベントの検出さえも複雑にする。
4. 機械規模での攻撃:おそらく最も重大なリスクは規模だろう。何千ものエージェント型ブラウザが一度に行動すると、協調的なインジェクションが数秒で企業全体に広がる可能性がある。かつては個別の侵害が必要だったことが、今では自律的に発生する。
新たなセキュリティパラダイム
エージェント型ブラウザを採用する企業は、並行して防御を進化させる必要がある。従来のブラウザ拡張機能、ファイアウォール、エンドポイント制御では不十分だ。次世代の安全なブラウジングを定義するいくつかの原則:
1. AIアクションのゼロトラスト:APIコール、メッセージ、取引など、すべての自律的アクションは、エージェントへの盲目的な信頼ではなく、ポリシーベースの承認を通じて検証されるべきである。
2. コンテキスト的ガードレール:セキュリティシステムは、コンテンツだけでなく意図も検査する必要がある。つまり、結果だけでなく、アクションの背後にあるコンテキストを監視することを意味する。
3. 継続的なレッドチーミング:AIシステムは、脆弱性に対してストレステストを行う継続的な敵対的テストを必要とする。新しいプロンプトベースおよび行動的エクスプロイトは、従来のパッチサイクルが対応できるよりも速く出現する。
4. 観測可能性と監査可能性:企業は、AIエージェントがなぜ行動したのか、つまりどのプロンプト、データソース、トリガーが決定を引き起こしたのかについての可視性を必要とする。透明なロギングと説明可能性はコンプライアンスの必需品となるだろう。
組織は、エージェント型ブラウザの小規模なパイロットから始め、成功のための明確な指標を定義しながら、これらのツールに徐々に自律性を付与すべきである。IDとアクセス制御は厳格に実施され、すべてのアクションがログに記録され追跡可能であるべきであり、実行時のガードレールはプロンプトインジェクションや不正なデータアクセスなどの安全でない行動を防止すべきである。
テレメトリを継続的に確認し、出力を検証し、敵対的テストを実施することで、企業は自信を持ってエージェント型ブラウザの使用を拡大し、機能するものをスケールしながら、必要に応じて介入したりロールバックしたりする能力を維持できる。



