AI

2025.11.01 22:08

AIの進化における次なる大きな飛躍

Adobe Stock

Adobe Stock

「これは一人の人間にとっては小さな一歩だが、人類にとっては偉大な飛躍である」

advertisement

記録に残る言葉には混乱があったものの、それは世界にとって大きな飛躍であり、その後半世紀以上にわたって繰り返されることのない出来事となった。約50年後の現在、私たちは宇宙のどこを探検するかではなく、異質で強大に感じるテクノロジーに対処する上で、グローバル社会としてどのような大きな一歩を踏み出すのかを考えている。

時に、映画『インディ・ジョーンズ/最後の聖戦』のインディアナ・ジョーンズのように、私たちは次の大きな飛躍が何になるかだけでなく、信念の飛躍が私たちを安全に導くのか、それとも危険に突き落とすのかを考えることがある。

多くの人が人工知能の不確実性について考える今、まさにそのような瞬間を迎えている。AIは今や詩を書き、絵を描き、経理作業をこなすことができる。次は何だろうか?

advertisement

AIの能力の拡散

現在、専門家たちが提唱している主要なアイデアの一つは、AIの次の大きなステップが、より良い言葉がないため「マルチモーダル」になるということだ。

これは、AIがこれまで主に行ってきたように、画面上で言葉で質問に答えるというテキストに限定されなくなることを意味する。音声やロボット工学によって、深みと次元が与えられる。音声、映像、さらには物理的な結果を生成したり、車両を運転したり、機器を操作したり、果物を摘んだりするだろう。

それがマルチモーダルAIだ。そしてそれは来ている。

「将来のAIアシスタントは、入力されたプロンプトに応答するだけでなく、ユーザーの声のトーン、表情、周囲の環境、社会的文脈を理解するようになるだろう」とサイエンスニュースデイリーのムハンマド・トゥヒン氏は書いている。「その結果、より直感的で適応性が高く、人間らしい対話ができるシステムが生まれるだろう」

私たちはこのような進化に備えるべきだ。

AIが私たち全員よりも多くを知るとき

そして、AIが人間よりも賢くなり、私たち個人のエージェントが人間社会全体よりも多くのことを知るようになる時点がある。

これには、LLMがより強力に進化しながらもスマートフォン上に存在できるエッジコンピューティングが関係している。レイ・カーツワイルの専門家やファンの間では、「誰もが最も賢いAIを持つようになる」という考えが広まっており、私たち一人ひとりが超人的な知性を操ることになるだろう—おそらくそれは即席のネットワークで他のAIと結びついている。(リード・ブラックマン氏のこのセグメントは興味深いと思った)。

それはどのように見えるか

私の同僚のラメシュ・ラスカー氏、そしてスタンフォード大学のテンギュ・マ教授、Anthropicのリサーチサイエンティストであるアンディ・ペン氏、Axiomのカリーナ・ホン氏が、AIの将来的な姿と、私たち全員がそこに到達するために踏み出す次の大きな一歩について語った(免責事項:私はLiquid AIのコンサルタントを務めている)。

際立ったアイデアの一つは、ラスカー氏がマービン・ミンスキーを引用し、ミンスキーの「心の社会」のように、大胆な新しいAIの世界は一つの巨大な集合知ではなく、分散型の知性ネットワークを含むだろうと示唆したことだ。ラスカー氏は企業のCEOを例に挙げた。

「私たちはCEOを会社で最も賢い人にしようとはせず、高度に中央集権化された知性のようなものではなく、CEOはむしろオーケストレーターのようなものだと考えます...知性は実際にはその会社のすべての賢い人々にあるのです」と彼は述べ、AIを中央集権的なインフラとして考えることは間違いかもしれないと示唆した。「こんな可能性を考えてみましょう。実は私たちはこれを完全に間違ったやり方でやっているかもしれない。すべてのデータを中央集権化し、すべての計算能力を中央集権化し、すべての人材を中央集権化する—これが(AI)をグローバルに考える正しい方法なのか、それとも違うやり方をすべきなのか?」

代替案として、彼はネットワークアプローチを説明した。

「(一つの)可能性は、知性について考える正しい方法は、世界中に多くのマイクロAIを作り、それらがローカルツール、ローカルデータ、ローカルコンテキストにアクセスできるようにすることです」と彼は言った。「そして、それらが互いに対話することで、一種のグローバルな知性が生まれるのです。」

彼はまた、企業戦略がすでにこの方向に向かっている可能性があるという前提も提起した。

「大企業について考えると、実際にはそれが彼らのやり方です。彼らはそれを認めていませんが、一つの大きなモデルを作る代わりに、『おそらくそれは専門家の混合体だ、あるいは専門家の混合体ではなく、タスクから抜け出すための推論かもしれない』と言っています。つまり、彼らはすでに知性の定義を分散化しているのです。」

推論能力の進歩

Axiomでモデル開発を先導しているホン氏は、数学やコード、推論における能力がいかに急速に進化したかについて語った。

「あらゆる数学の問題と解法の証明をコンピュータバージョン、つまりコンピュータコードに変換し、コーディングにおける強化学習で見られるような信じられないほどの成功を得ることができます」と彼女は述べた。「そのため、私たちAxiomでは、検証可能な超知性としてのAIの次のフロンティアにとても興奮しています。私たちは検証可能な領域で自己改善するシステムを構築したいと考えています。それによってモデルが間違えたことを振り返り、正しかったことを振り返り、そして複数のモデルが互いに対話して性能を継続的に向上させることができます。これこそが、AIの次なる飛躍だと私たちは信じています。」

多くのモデルは必要ない

その分散化理論を進めるにあたり、ラスカー氏は市場にはモデル作成者がたくさん必要なわけではなく、特定のシステムをエッジデバイスに大量に複製するだけでよいと指摘した。

「それらはあなたのスマートフォンに収まり、ラップトップに収まり、今日のモデルよりもさらに優れたものになるでしょう」と彼は言った。「すべてのモデルは非常に小さくなります。モデルは高度に商品化されると思います。大手モデル作成企業はモデル作成のビジネスから撤退する可能性があると思います。なぜなら、ご存知のように、トークンコストは毎年100倍のペースで減少しているからです。それは底辺への競争です。だから本当の価値は、これらのモデルがすべて非常に小さなタスク向けに蒸留されるか、新たに訓練されることから生まれると思います。それが健康や法律、私自身の生活、私自身のカレンダー、私自身のメールに関するものであれ、私は自分のマシンでローカルに実行し、そして私のエージェントや私のAIがあなたのAIや他の科学者などと対話するとき、そこから新しい知性が生まれるのです。」

大規模知性の働き

「私たちは大規模知性の時代に入りつつあると思います」とホン氏はさらに発展させて述べた。「推論のコストがますます弾力的になるにつれて、私たちがまだ解放するツールを持っていなかった予期せぬユースケースや市場がますます増えていくでしょう。」

これが示唆するのは、グローバルな進歩のための「大規模な基盤」だと彼女は述べた。「(それは)物理学、工学など多くのものです」と彼女は言った。「コンピュータサイエンスや私たちが解決しているアルゴリズムの問題の多くは数学に基づいていると言えるでしょう...(それは)AIによって活用される数学と基礎科学の信じられないほどの力であり、応用科学のすべてに前例のないスピードで拡大され適用されるのです。それが大規模知性の意味するところです。」

Anthropicのデータリクエスト

パネルディスカッションでは、トークン、AGIの出現などについて、トランスクリプトやビデオで入手可能な多くの内容があった。しかし終盤に、誰かがAnthropicについて質問し、ペン氏は法務部門ではなく同社の科学的役割を担当していると断った上で、同社が最近データポリシーを変更し、より多くのユーザーデータを求めるようになった理由を説明した。

「部分的には、特定のユーザーに役立つモデルをどのように構築するか、そしてそれがユーザー間でどのように異なるかを理解したいと考えています」と彼女は述べた。「(MITの教授)に役立つものは、初めてコーディングする中学生に役立つものとは異なります。このようなユーザーフィードバックの一部は、異なる顧客や異なるユースケースをどのように最もよくサポートできるかをより良く理解するのに役立ちます。これをどのように積極的に使用する予定なのかについて明示的に公開された計画があるかどうかは正確にはわかりませんが、私たちが探求していることであり、将来的に期待していることです。」

これらが、これらの専門家たちがまもなく期待している大きな飛躍のいくつかだ。学術界とビジネス界からの意見を聞くことで、私たち全員が今後何が起こるかについてより多くの情報を得ることができる。今後の展開に注目しよう。

forbes.com 原文

タグ:

advertisement

ForbesBrandVoice

人気記事