スタンフォード大学・人間中心AI研究所が公表した「2026年 AI Index Report」によれば、ヒューマノイドロボット(2足歩行型ロボット)は一般的な家事を安全に完遂する能力が驚くほど低い。現在では、あるヒューマノイドロボットを約5000ドル(約79万5000円)で購入することも、1Xの「Neo」を2万ドル(約318万円)で注文することも、AiMogaの新型「M1」を4万ドル(約636万円)強で手に入れることもできる。しかし、こうしたロボットが機械仕掛けの賢い執事のように働くと期待してはならない。
少なくとも、今はまだそうではない。
AIはおそらく国際数学オリンピックで金メダルを獲れる水準にある。人間の化学者を上回る成果を出し、かなり質の高いコードを書き、世界で最も堅牢なソフトウェアに潜むゼロデイ脆弱性(未公表の未修正の欠陥)さえ見つけ出せる。だが、脱ぎ散らかした靴下を確実に拾い上げることは、できないかもしれない。実際、現在のAIを搭載した現在のロボットが、現実の家事を安全に完全成功できる割合は、約12%にすぎない。
スタンフォード大学のレポートによれば、管理されたソフトウェア・シミュレーションの中では、ロボットの成功率は89.4%という印象的な水準に達しており、2022年時点の約48%から大きく伸びた。しかし、雑然として予測不能な現実世界に持ち込むと、その成功率は一気に急落する。
レポートは次のように述べている。
「AIにとって最も難しいベンチマークは、現実世界で行動することを求めるものである。そこでは環境が予測不能であり、ミスが物理的な結果を伴うからだ。最上位のモデルでさえ、3分の1超の作業を安全に完了できず、作業の完了と安全性を同時に満たさなければならない場合には、失敗が頻繁に見られた」。
現実は厳しい。床は滑りやすくなっているし、コップはロボットの手から見て斜めを向いていることがある。引き出しは開けようとすると少し引っかかるかもしれないし、子どもがレゴを床に放置しているかもしれない。
根本的な問題がある。最先端のAIモデルは、インターネット上の「言葉」を使って学習している。意味の通るように単語を次々と並べる能力を身につけるには、それで十分だ。しかし、現実世界で物理的な動作を実行するための計画を立てるとなると、難しさは格段に増す。これは「フィジカルAI」や「ワールド基盤モデル(world foundation model:世界を汎用的に理解する基盤モデル)」が担うべき課題である。
そして、それらはまだ十分に成熟していない。
「これらのモデルが管理された環境でできることと、現実世界で対応できることの間には、依然として大きな隔たりがある」とレポートは指摘する。
家庭で機能するヒューマノイドロボットにとって、最も厳しい試験の1つが「Behavior-1K」(ビヘイビア・ワンケイ)だ。これは、実際の人々が自宅でロボットにしてほしいこととして挙げた内容に基づく、現実世界の1000件の作業で構成されたベンチマークだ。最近のチャレンジで最も好成績だったチームでも、「許容可能」とされる品質水準でこれらの作業を達成できた割合は25%にとどまり、作業を完全に成功させた率はそれを大きく下回った。
これは、ロボットの動作や振る舞いを安全かつ確実に導く方法を理解するには、さらに多くの研究が必要であることを意味している。
明るい材料もある。Figure AIのような先進的なロボット企業は、家庭環境でロボットを訓練し、食洗機の中身を片付けたり、買ってきた食料品を収納したりといった現実の作業を最後までやらせている。最新の動画を見ると、ロボットの動作は素早くはないものの、冷蔵庫に入れるべきものと戸棚にしまうべきものをかなり賢く判別している。
筆者が昨年1月、未来学者でエンジニアのピーター・ディアマンディスにヒューマノイドロボットについて取材した際、同氏は2026年中に少なくとも一部のヒューマノイドロボットが家庭に入るようになると予測した。
その予測は現実となった。
次の段階は、ロボットを手の届く価格で真に役立つ存在にすることだ。スタンフォード大学のレポートによれば、その目標について「達成した」と断言できるようになるまでには、なお改善の余地が残されている。



