2026.06.10 09:32

AIエージェントの新時代──人間の注意力を取り戻す自律型アシスタントの可能性

John Werner | Contributor

著者フォロー

記事を保存

著者フォロー

記事を保存

Adobe Stock

人工知能に関して、我々は今、興味深い瞬間を迎えている。ここ数年、より正確には、一般に公開された「リテール」AI技術の最初の兆しが現れて以来、我々は「第1波」と呼べるAIを精査してきた。それは、人間の認知を近似できるが、いわば「グーグル検索」的な方法でのみ機能する大規模言語モデル（LLM）であり、情報を提供し、整理し、一般的に扱うものだ。ある意味では入出力モデルの延長線上にあるが、驚くほど人間らしいものである。

しかし今、我々は新しいものへと向かっている。自律型タスクエンジンだ。人々が「AIエンティティを知覚力のあるものにできるか」と考え続ける一方で、他の人々は、知覚力があろうとなかろうと、AIは我々のために日常的なタスクを処理できる、あるいはより長期的で複数のステップを要するタスクさえも処理できると示唆している。

その文脈において、これがどのようなものになるかについて、多くの考察がなされている。マイクロソフトが2025年初頭に設立したTrusted Technology Groupのジェニー・レイ=フラリー氏へのインタビューを例に挙げよう。レイ=フラリー氏は、視覚障害者への支援や公平なAI開発の他の側面について語っている。

「どうすれば正しく構築できるのか。そして、どうすればそれを正しく保ち続けられるのか。社会は必ずしも最も包括的な場所ではないため、データを挿入してトレーニングしなければならない場合がある」と彼女は述べた。

パネルディスカッション

先月開催されたImagination in Actionイベントのパネルで、専門家グループとともに、我々の生活を楽にするタスク支援システムである「パーソナルエージェント」の登場を評価する議論が行われた。（免責事項：4月のIIAイベントは、私が進行を支援している年次カンファレンスである。）

我々MIT コミュニティのマリア・ゴルスキフ氏は、OpenClawと、人々が現在取り組んでいる代替案について言及した。ゴルスキフ氏はプロジェクトNANDAに取り組んでおり、私は過去に何度もこれについて書いてきた。

「今年起こった本当に重要なことは、OpenClawだった」と彼女は述べた。「OpenClawが特に重要だったのは、パーソナルAIエージェントの大量採用を開始し、バズったからだ。今や非技術者と技術者が一緒になって、エージェントの世界とエージェント的なウェブに興奮している」

パネリストのジョーダン・ティアン氏（ZeroClawLabsの共同創設者）は、Raspberry Piやその他のコンポーネントでハードウェアのフットプリントを縮小することについて語った。

「アイデアは、我々は徹底的に小型化し、どんなハードウェアにも展開できる小さなものを作りたかった」とティアン氏は述べ、AIエッジコンピューティングの価値を強調した。「当時、誰もがサンドボックス化して自分のMac Miniを手に入れることを考えていたが、我々は『もっと小さくできたらどうだろう』と考えた」

ガードレール

「我々は、同意を与える主体性を持たない人々のための、非常に特定のユースケースを作ることに注力している。なぜなら、パーソナルエージェントには同意が必要だからだ」とパネリストのウズマ・ファーヒーン氏（Keep AI Safe ディレクター）は述べた。「それには2つの側面がある。1つはインフラと技術的能力であり、もう1つは使用法だ。そのために、我々は実際にエージェントを作成するためのプラットフォームを構築している。エージェントは互いに会話し、人間の相互作用をシミュレートして、エージェントとモデルがどこで破綻するかを確認できる」

これらのテストケースを処理するフレームワークの必要性を訴え、彼女はガードレール開発の緊急性について言及した。

「イノベーションが起こると、安全性は後回しになりがちだ」と彼女は述べた。

パネリストのグレッグ・ライズ氏（Founder's Edgeのゼネラルパートナー）は、ユーザーデザインに関するいくつかの考えを述べた。

「我々は歴史上、本当に興味深い転換点にいると思う」と彼は述べた。「私は小規模なベンチャーファームを運営している。ユーザーエクスペリエンスについて多く考える。歴史を振り返ると、最大の変化は入力と出力の変化にすぎない」

彼はパーソナルAIの初期段階の状況に言及した。

「我々は声を使うことができ、委任することができる」と彼は述べた。「そして繰り返すが、我々は信頼を構築する初期段階にある」

パネリストのニレシュ・アガルワル氏も同意した。

「消費者の心には多くの不安と好奇心がある」と彼は述べた。「AIエージェントが来ているが、それがどのようなものになるかを理解するのは難しい」

いくつかの課題と制限

迅速な設計プロセスとAIエージェントの普及に対する障害について語り、ゴルスキフ氏は2つのコストが関係すると述べた。1つはホスティングのコスト、もう1つは推論のコストだ。

「誰もが安価で信頼性が高く、安全でアクセス可能なエージェントを持つためには、この2つの障壁を本当に解決する必要がある」と彼女は述べた。

未来を描く

会話の後半で、モデレーターのグンジャン・シンハ氏は、支援AIエージェントの最終目標についてどう考えるかをパネルに尋ねた。

「ここでの成功とは何か」と彼は尋ねた。「消費者のために本当に勝利しているエージェントとは、人々が価値を置く特定のユースケースになるのか、それともオーケストレーターとしてさまざまな分野に適用される、より水平的なものになるのか」

ゴルスキフ氏は、ユーザーの職業に特化したAIエージェントについて理論化した。ティアン氏は、パーソナルテクノロジーの段階的な発展について、その過程における主要なランドマークとともに議論した。

「目標を与えれば、これらのことをただ実行できるはずだ」と彼は述べた。「アプリがこれらのタイプのことを実行できるように調整されるにつれて、範囲は拡大する。パーソナルAIアシスタント、次世代、そしてさらに自律的になり、通常は電話を通じて行わなければならないようなことを、あなたのために実行し続けることができるようになると思う」

ライズ氏は、AIエージェントがユーザーのために情報をキュレートし、焦点を集中させる力について言及した。これは、AIが我々の脳に与えた初期の影響の一部を逆転させる方法であり、数年前に発表された「Attention is All You Need」という論文を引用した。

「AIは実際に我々の注意を多方向に分散させた」と彼は述べた。「エージェント的なツールが成功し始めるのは、我々の注意を取り戻すときだと思う。なぜなら、それらは実際に我々にとって重要なものを表面化させるからだ」

追加の方向付け戦略として、アガルワル氏は、人々は今人気のあるエージェントを見て、推定すべきだと提案した。

我々のADHD脳

シンハ氏は、ゴルスキフ氏のパーソナル特化のアイデアと、ライズ氏の注意に関する指摘について見解を述べた。

「エージェントは、そもそも彼らが我々のために作り出したADHDを修正するためにここにいるのだろうか」と彼は尋ねた。

私はこれが興味深い糸口だと思った。なぜなら、我々の多くが直感的に、新しいテクノロジーが、与えられた刺激に集中し、中心を定める我々自身の人間的能力を分裂させたと感じているからだ。そして、これらのエージェントが、この問題を解決するのに役立つ何らかのタスク処理を行うと想像する。

「私が構築した最初のパーソナル『チーフ・オブ・スタッフ』エージェントは、まさにこのようなものだった」とライズ氏は述べた。「プロンプトは『気を散らすものがたくさんあるので、タスクと集中を維持するのを助けてほしい』というようなものだった。AIはこれが本当に得意だ。なぜなら、多くの異なるソースから情報を統合し、優先順位のコンテナを作成できるからだ。これにより、より軌道に乗り続けることができる」

大きな一歩

エージェント的AIの歴史に言及し、アガルワル氏は近い将来の大きな進歩を求めた。

「コーディングエージェントの例を使うと、彼らはソフトウェア開発者の生活を段階的に改善しなかった」と彼は述べた。「彼らの生活を10倍、100倍良くした。だから使われている。我々はそれらのユースケース、即座のユースケースを見つける必要がある。すべての人が『はい、これなしでは生きられない』と言える方法を見つける必要がある」

自身の研究の詳細を述べ、ゴルスキフ氏は、AIエージェントが人間のユーザーが「退屈なこと」に対処するのをどのように助けることができるかについて語ったが、OpenClawに受信トレイを実行させることはまだ信頼していないと述べた。ティアン氏は、エージェントがブラウジングの好みでユーザーを支援し、フィードを自動化する能力について言及した。

その後、パネリストたちは、オープンソースモデルと、ユーザーのプライバシーを保護するクローズドシステムの間で、タスクとデータの分配を分解し始める会話が続いた。一部の人々は、重要な質問に対する不信や懐疑を提起した。エージェントは拡張のために構築されているのか、それともエンゲージメントのためか。アガルワル氏は、一般的な消費者の考え方を指摘した。システムが安全かどうか、または正しいユースケースに焦点を当てているかどうかではなく、無料で提供されているかどうかだ。

上記のすべてが、伝統的な境界のない世界について考えさせる。我々がその世界をどのようにナビゲートするかは異なるだろう。我々は始める必要がある。

（forbes.com 原文）