マドゥリマ・マンチャラ氏は、Maps.aiの創業者であり、アーリーステージのベンチャーキャピタル投資家である。
それほど昔ではない時代、機械が説得力のあるエッセイを書いたり、コンピューターコードを作成したり、複雑な法的文書を要約したりするという発想は、主にSFの領域に属していた。今日、それは日常的なことになっている。何百万人もの人々が、大規模言語モデル(LLM)に相談することで1日の仕事を始め、メールの下書き、データ分析、複雑な問題の解決を依頼している。
驚くほど短い期間で、AIは人間の思考の多くを定義する媒体である言語を操作することを学んだ。LLMは今や詩を書き、ソフトウェアを生成し、膨大な知識体系を驚くべき流暢さで統合する。マーケティングキャンペーンの草案を作成し、医師の文書作成を支援し、弁護士が契約書を精査するのを手伝う。世界中のオフィスで、これらのシステムはツールというよりも協力者として機能し、アイデアとその実行の間の距離を縮めている。
次なるフロンティア
アラン・チューリングが機械は考えることができるかと問いかけてから70年以上が経過し、その問いは哲学的というよりも実践的なものに感じられるようになってきた。テキストと情報という記号的な世界において、機械はすでに驚くほど有能であることを証明している。
しかし、言語の習得は世界の習得と同じではない──これは研究者と投資家の間で高まりつつある認識である。AIは言葉とデータという記号的な世界において極めて有能になったが、物理的な世界においては依然として限定的である。
経済の多くの領域で、企業はすでにモデルに仕事の初期段階を割り当てている。AIはレポートの草案を作成し、予備的な分析を実行し、意思決定を支援する。Anthropic(アンソロピック)の調査によると、このテクノロジーは労働市場全体に急速に広がっているが、仕事全体を置き換えることはまれである。代わりに、仕事の一部を吸収する傾向があり、人間の仕事を排除するのではなく拡張している。
多くの研究者が信じるところによれば、知能の次なるフロンティアは、言語的なものではないかもしれない。それは物理的なものかもしれない。
ロボティクスと身体性を持つ知能の台頭
変化は最も複雑なレベルで展開し始めている。中国の旧正月の祝賀行事でカンフーのパフォーマンスを披露するヒューマノイドロボットから、ハーフマラソンを走り、古代ローマ遺跡で安全検査を実行するロボットまで、身体性を持つ機械はもはや遠い未来のビジョンではない。
ボストン・ダイナミクスのSpotのようなロボット犬は、すでに現実世界の環境で稼働しており、インフラの検査、危険な地形のナビゲーション、産業オペレーションの支援を行っている。
見世物を超えて、この変化は静かに職場に到達している。倉庫、配送センター、工場のフロアで、企業は人間の従業員と並んで働くように設計されたヒューマノイドロボットを実験している。これらの機械は、労働者を完全に置き換えることを意図していない。代わりに、身体的に負担が大きく、反復的で、怪我をしやすいタスク──重いコンテナの移動から広大な物流施設全体での商品の輸送まで──を処理するように訓練されている。
テスラのOptimusは最も目に見える例の1つであり、反復的または危険なタスクを実行し、最終的には工場で人間の労働力と並んで稼働するように設計されている。
AI(人工知能)は、ロボットの構築方法も再構築している。かつては何年もの工学的努力を必要としたシステムが、今では大規模なデータセットで訓練できるようになった。シミュレーション環境により、エンジニアはロボットが現実世界に触れる前に、何千ものシナリオを仮想的にテストできる。かつては手作業で作成されたルールに依存していた動作計画と制御システムは、大規模な訓練と強化学習を通じてますます学習されるようになっている。
その結果、ロボットシステムの構築はより速く、多くの場合、かつてよりも安価になった。長い間ロボティクスの中心的なボトルネックと考えられていたハードウェア製造は、もはや唯一の制約ではない。
代わりに、限界は機械自体の物理学へとシフトしている。バッテリー容量、充電サイクル、電力密度は依然として、ロボットがどれだけ長く働けるか、どこで現実的に稼働できるかを決定している。しかし、デジタル知能から物理的能力への移行は、依然として最大の課題の1つである。
根本的なハードウェアの限界
今年のAI House Davosにおける身体性を持つAIに関する炉辺談話で、Advanced Machine Intelligenceの創業者兼エグゼクティブチェアマンであるヤン・ルカン氏は、AIを妨げている根本的なハードウェアの限界を説明した。
生物学的な脳では、各シナプスとニューロンが物理的な計算要素として存在する。シリコンのニューラルネットワークでは、同じハードウェアが複数のニューロンの出力を計算するために再利用され、メモリと処理の間でデータを絶えず移動させる必要があり、これがエネルギーの主な消費源となっている。
高度なGPU(画像処理装置)でさえ生物学的効率には及ばず、現在の製造技術では1つのニューロンに1つのデバイスを専用にすることは不可能である。ギャップはスケーラビリティに関するものである。ルカン氏が指摘したように、ニューラルネットワークにより多くのGPUを投入しても、業界がデータ移動の物理的限界に達しているため、収穫逓減が生じる。
これらの制約にもかかわらず、研究者たちは前進を続けており、空間モデルと身体性を持つロボティクスを使用して、デジタル知能と物理的知能の間のギャップを埋めている。視覚データから環境の一貫した三次元表現を構築できるシステムが現在存在し、ロボットに空間のより豊かな理解を与え、人間の直感に似始める方法で物体、動き、相互作用について推論できるようにしている。
AIは最初に言葉を習得したかもしれないが、その野心はますます物理的になっている。空間モデルは機械の世界理解を深め、ヒューマノイドシステムは進化を続け、身体性を持つ知能は研究室から実体経済へと移行している。
AIの次なる段階は、スクリーンや文書の中だけで展開されるのではないかもしれない。それは、物理世界が構築され維持される工場、倉庫、都市で展開されるかもしれない。



