製品

2025.12.04 19:36

ロボットが教えてくれた「デプロイメント」「データ」「現実世界」の真実

Adobe Stock

Adobe Stock

アシス・ゴーシュ、Peanut Robotics共同創業者兼CTO。

私たちはしばしばロボットを、完璧に調整され、コードとセンサーと調和して稼働する、無菌状態の工場や研究所にいるものとして想像します。しかしロボット工学の真の試練は、そうした管理された環境の外、つまり人々が生活し働くホテルの廊下やアパート、オフィスで起こります。

Peanut Roboticsでは、優れたデモと優れたデプロイメントの間の距離は、エッジケース、つまりテクノロジーがその能力の限界で使用されたときに何が起こるかによって測られることを学びました。そしてそれを苦い経験から学んだのです—実際にロボットを現場に投入し、毎日それに依存する顧客から実際の収益を得ることで。

私たちの最初の製品であるロボット清掃機は、テストでは完璧に機能しました。正確にナビゲーション、清掃、実行を行いました。そして実際のデプロイメントが始まると、「成功」がいかに脆いものであるかを現実が示してくれました。

シンクの高さなどの細部は部屋ごとに異なっていました。家具やタオルがバスルームの入り口を塞いでいることもありました。誰かがバスルームのカウンターにワイングラスを置いていたこともあります。こうした小さな変化の一つ一つが、何ヶ月もの開発期間中は安定していた前提条件を崩してしまいました。どれか一つが単独で故障を引き起こすわけではありませんが、それらが合わさると常に予想外の事態が発生し、信頼性が継続的な課題となりました。

学んだ教訓

私たちは、研究室から現実を工学的に解決することはできないと気づきました。現場でのデプロイメントとエンジニアリングの間にループが必要でした—あらゆる失敗を新しいトレーニングデータに変えるループです。

私たちはエッジケースを自動的に記録し、テスト環境で再現するフィードバックシステムを構築しました。世界モデルを事前に完璧にするのではなく、デプロイメントが改善を促進するようにしました。このアプローチによってロボットが完璧になったわけではありませんが、適応力を持たせることができました。

また、レジリエンス(回復力)は技術的なものだけではないことも学びました。最も信頼性の高いシステムは、コードとプロセスの両方で適応するものでした。時には、解決策はソフトウェアにあるのではなく、清掃スタッフがロボットとどう関わるか、あるいはサービスワークフローをどう設計するかにありました。

最大の運用上の課題は、ロボットの故障ではなく、現場の問題に対応しながら研究開発を進めるという絶え間ないプレッシャーでした。すべてのデプロイメントは貴重なフィードバックを生み出しましたが、チームを圧倒することなくその情報を活用するには規律が必要でした。

私たちはバランスを取る必要がありました:顧客を満足させるために十分速く対応しつつも、エンジニアリングチームが消火隊になってしまうほど急ぎすぎないこと。これは、どの問題がシステム上の弱点を明らかにしているのか、あるいはどれが一回限りの異常なのかを優先順位付けすることを意味しました。すべてを記録し、週単位で選別し、ロボットをより汎用性のあるものにする修正にのみ投資することを学びました。

その規律によって、私たちはデプロイメントを進め、安定した収益の流れを維持しながら、製品を改善し続けることができました。また、場当たり的な修正ではなく一貫した進歩を見せることで、顧客との信頼関係も構築できました。

認識と制御

現場での最も厄介な問題の多くは、最終的には認識と制御の問題に行き着きました。これはAIが具体的な違いを生み出せる領域です。デプロイメントが拡大するにつれ、ロボットが周囲を理解し相互作用する方法をより適応的にするために、学習ベースのモデルをスタックに統合し始めました。

私たちの制御フレームワークは、慎重な調整によって最適化された古典的なシステムとして始まりました。しかし、狭いバスルームスペースから濡れた床まで、実際の環境の変動性は、純粋にルールベースの動作の限界を露呈させました。私たちは、ロボットがこれらの条件をより適切に予測し対応できるよう、強化学習アプローチを探求し、実際のデプロイメントデータを使用して動作戦略とカバレッジ効率を向上させました。この基盤により、スクリプトのようなものではなく、コンテキストに合わせて調整するパートナーのようなコントローラーを設計することができました。

より大きな飛躍は認識の面で起こりました。バスルームは視覚的に予測不可能です:反射、タオル、迷い込んだ髪の毛など、すべてが従来のビジョンシステムに混乱をもたらします。最新の製品世代では、ビジョン言語モデル(VLM)を組み込み、ロボットにシーンのより高レベルな理解を与えました。狭い検出器に頼るのではなく、目の前にあるものを解釈できるようになりました—髪の毛と目地線の区別、反射と残留物の区別—そしてそれに応じて清掃の判断を下せるようになりました。この追加により、現場での信頼性が劇的に向上し、誤検出が減少しました。

古典的な制御と現代のAIを融合させることは、一方を他方に置き換えることではなく、構造と適応性を融合させることでした。これにより、私たちのロボットは研究室だけでなく、人々が実際に生活し働く予測不可能な空間でも成功できるようになりました。

挫折から資産へ

振り返ってみると、かつては挫折と感じられたエッジケースが、私たちの最大の資産となりました。それぞれの建物、廊下、照明条件が、ロボットが対処できる範囲を拡大しました。真の知的財産は、アルゴリズムだけにあるのではなく、何千もの実際のインタラクションから構築された苦労して獲得した堅牢性にありました。

世界は常に予測不可能ですが、すべての失敗はデータポイントです。成功する企業は、混沌を避ける企業ではなく、そこから最も速く学ぶ企業でしょう。

forbes.com 原文

タグ:

advertisement

ForbesBrandVoice

人気記事