なぜロボットは皿洗いができないのか?実はできるのだが、おそらく私たちが期待するほど上手くあるいは安価にはできない。これまで何度か、ロボット工学の記事を書く際に20世紀後半の「ジェットソン家」というテレビアニメに言及してきた。私たちが「空飛ぶ車はどこにあるのか?」と嘆くように、アニメに登場するエプロン姿のお手伝いのように、私たちが退屈で面倒だと思う家事をこなしてくれるロボット執事やメイドがいないことも嘆いている。
しかし今、実際にこの種の技術が初めて実用化されつつある中で、それがいかに難しいかがより明確に見えてきた。ここでは、ロボットAIの限界について耳にしたことをいくつか紹介する。これらは、皿洗いロボットの登場が遅れている理由を考えると非常に納得できる内容だ。
モラベックのパラドックスと自然選択の美しさ
最近初めて知ったのだが、例えば、なぜディープ・ブルーが1997年にカスパロフに勝ったのに、いまだに家事をするロボットがないのかを調査していた時のことだ。モラベックのパラドックスによれば、コンピュータは純粋な知性においては私たちを圧倒できるが、実世界での活動はいまだに人間の領域だという。少し調べてみれば、マービン・ミンスキーのような著名人たちが、カーネギーメロン大学で働いていたオーストリア人のハンス・モラベックに由来するこの概念を1980年代から熟知していたことがわかる。
しかし私にとって、その背後にある理由こそが非常に魅力的だ。なぜ人間は物理的な世界でモノを操作することにこれほど長けているのか、そしてなぜロボットがそれに追随するのはこれほど難しいのか?
その答えは?チャールズ・ダーウィンだ。より正確には、自然選択の原理である。これは、私たちがこれらのスキルを時間をかけて—例えば、数百万年かけて—向上させてきたという主張だ。
つまり、私たちには大きなアドバンテージがあるのだ。
原始人類の器用さが劣っていたと思うか、それともより学術的な理論なのだろうか?
いずれにせよ、モラベックのパラドックスは、ロボットが実世界で本当に効果的になるためには、センサー以上のものが必要である理由を説明するのに大いに役立つ。その課題は、微細な運動技能と意思決定、物理学の知識と直感を組み合わせたものだ。物理学の知識に関しては、その多くが直感的、本能的、生まれつきのものかもしれない—私たちにとっては。それは不思議なことではないだろうか?
ロボット工学研究のさらなる問題
実用的なロボット工学の限界を見るもう一つの方法は、LLMからリストを取得することだ。Microsoft Copilotは、プロンプトに対して単に次のように述べている:ヒューマノイドロボットの複雑さ、市場の課題、効率の欠如、技術的限界、そして「投資と忍耐」、つまり、多くの周辺技術がその時代が再び巡ってくるまで運命づけられるROI(投資収益率)の障害を再提示している。
ChatGPTはもう少し雄弁だった:
Q:「なぜロボットが家事をするのはそんなに難しいのか?」
A:「家事は、厄介な知覚+複雑な手作業+無限のエッジケースの厄介な組み合わせだからだ。ロボットは変化する光の中で散らかったものを認識し、ペットや子供の周りで安全な動きを計画し、柔らかく、滑りやすく、しわくちゃなもの(洗濯物、スポンジ、ゴミ袋)を操作しなければならない。また、家は標準化されていない。人間は苦もなく一般化するが、ロボットは低コストでそのような堅牢性を実現するのにまだ苦戦している。」
そう、確かにゴミ袋を扱わなければならない。そしてスポンジも。しかし、「ペットや子供の周りで安全な動きを計画する」というもう一つの部分が、パズルのより大きな部分だと思う。
ロボット工学者の考察
さらに、最近のTEDトークでナビド・アガサデギ氏(ボストン・ダイナミクスなどでこれらのプロジェクトに取り組んできた人物)が、家事ロボットを構築する上でのさまざまな障壁について述べている。
「ジェットソン家のロージーのように、家の周りを動き回って、皿洗いや洗濯をしてくれて、家族と過ごす時間をもっと増やせるようなロボットはまだありません」とアガサデギ氏は言う。「そして、私はこのことに少なくとも部分的には責任があると感じています。なぜなら、私は過去15年間ロボット工学に携わってきたからです。」
ある意味では、それはソフトウェアとハードウェアの交差点に行き着くと彼は主張した。
「ソフトウェアを正しく作る必要があります」とアガサデギ氏は付け加えた。「それが知性です。ソフトウェアはロボットに世界をどう解釈するかを教え、また実際に何か役立つことをするために、どのような一連の行動を取るべきかもロボットに教えなければなりません。それができたら、当然ハードウェアも必要です。つまり、ロボットの関節を動かし、全体としてロボット全体を動かすことができるアクチュエーターが必要で、ロボットが環境に力を加えて役立つことができるようにする必要があります。」
さらに、彼は続けて、ロボットが周囲の世界を正確に認識するのを助けるために多くのセンサーが必要であり、これらすべてのものを規模を持って追加する必要があると述べた。
彼もまたモラベックのパラドックスを引用しているが、最後にひねりを加えている:
「チェスのグランドマスターに勝てるチェスエンジンを作る前に、単純な歩行ができるロボットを作ることができます。あるいは、異なるサイズのオブジェクトを掴み、操作し、オブジェクトを積み重ねることができるロボットを作ることができます」と彼は言った。「これらは1歳か2歳の人間の赤ちゃんが非常に速く学ぶことですが、ロボットは長い間これに失敗し続けており、インターネットには今までのロボットの失敗動画がたくさんあります。」
そして、ここで転換点が来る:
「しかし、物事はまさに変わろうとしています…」
進化の段階
説明するために、アガサデギ氏は現在までのロボット工学の3つの異なる段階を示した。
最初は単に無思考に動き回るロボットのクラスだった。
「これらは位置AからBに移動するロボットでした」とアガサデギ氏は言った。「彼らは実際には知覚を持っていなかったので、環境を見ることができませんでした。彼らはただこのタスクを実行する方法を知っていただけです。そのため、本質的に安全ではなく、正確に製造され、すべてが適切な場所にある環境でのみ操作できました。」
彼が特定した第二段階は「計画と知覚」で、ロボットが周囲の世界を見て理解し始め、複数段階のタスクについて推論できるようになった。
第三は彼が「AIを搭載したロボット」と呼ぶもので、ロボットに搭載されたAIが一種の不気味な知性を与えるものだ。
「これらのロボットは、ChatGPTや画像生成技術を駆動するのと同じ種類のAIによって動かされており、これらはタスクを超えて一般化する技術です」と彼は言った。「つまり、私たちは今、汎用学習マシンと汎用学習アルゴリズムを持っています…ChatGPTを駆動しているのと同じLLMが…今やロボットの脳に組み込まれています。そして誰かがロボットにキッチンを掃除し、キャビネットを閉め、皿洗いをするように頼むことができ、ロボットはまず言語を理解し、プロンプトを理解し、タスクを達成するために行うべき一連のアクションとして計画し、さらに環境を理解し、その関数として、これらの一連のタスクを決定することができます。」
世界から学ぶ
「これはロボット工学が解決されたことを意味するのでしょうか?」とアガサデギ氏は修辞的に尋ねた。「答えは、まだそうではなく、主な問題は…データの問題です。」
要するに、アガサデギ氏は、ChatGPTがウェブの広大な領域を使って事実について学ぶことができるが、例えば物体の持ち方を学ぶためのロボットに力を与える実世界のデータベースはまだ存在しないと示唆している。彼は、研究者たちが新世代のロボットのためにそのようなデータセットを構築するための「遠隔操作」のタスクに懸命に取り組んでいると付け加えた。
「これは来年には私たちのために走り回って物事をしてくれるロボットがいることを意味するのでしょうか?」とアガサデギ氏は言った。「私はまだそこまでではないと言うでしょう。ここでの類推は、ロボットは数年前のパームパイロットの位置にあるということです。もし十分な年齢であれば覚えているでしょうが、ロボット工学には、iPhoneが起こしたような革命が必要です。ロボット工学が実際に私たちの周りにあるようになるためには…ロボット工学は実際に人類の鏡として機能することができます。つまり、人間を拡張するためにどのような技術を構築する必要があるかを理解することで、私たち自身をより良く理解することができるのです。そして、それが私が望む未来です。私たちがさらに繁栄できるような技術を構築することができるように。」
これらすべては、ロボット化されたAIの障壁と、大胆かつ自信を持って前進する方法についての提案への魅力的な探求である。そしていつの日か、あなたがやらなくても良いように、ロボットが皿洗いをしてくれるだろう。



