ヤシュ・シンハ氏は、AI(人工知能)とロボティクスを材料発見に応用するロボティクスエンジニアである。
ロボティクス分野への投資額は2024年に72億ドルに達した。Figure AIは企業価値評価額390億ドルで10億ドルを調達した。Physical Intelligenceは企業価値評価額56億ドルで6億ドルを獲得した。見出しは魅力的だが、真の機会はどこにあるのだろうか。
ロボティクス分野で長年働いてきた経験から、この領域で永続的なビジネスを構築するために必要なことを考察してきた。私の現在の見解は、探求する価値のある2つの明確な道筋が存在するというものだ。
第一の道筋:真の危機を解決する
第一の道筋は、ロボティクスが緊急かつ構造的な問題に対処する応用分野を見つけることだ。すべての問題が該当するわけではない。私は3つの基準について考える。人口動態が悪化させるだけで解決しない、真の労働力危機が存在するか。ユニットエコノミクスは楽観的な予測ではなく、今日機能するか。そして社会は実際にこの役割でロボットを受け入れるか。
一部のセクターにおける労働力の数字は顕著だ。米国の建設業界は2025年だけで43万9000人の新規労働者を必要としている。現在の労働力の推定41%が2031年までに退職する見込みだ。これに加えて、高齢者介護は2032年までに460万人の未充足雇用が予測されており、長期介護の労働力ギャップは他のどの医療セクターよりも深刻だ。これらは循環的な不足ではない。高齢化する人口と出生率の低下が、状況の悪化を保証している。
しかし労働力不足だけでは十分ではない。経済性が今機能する必要がある。テスラはOptimusロボット1台あたり2万ドルから3万ドルを量産時の目標としているが、現在のヒューマノイド製造は1台あたり3万ドルから20万ドルで推移している。ある分析によれば、5年間で10万5000ドルのコストがかかるロボットは、エントリーレベルの労働者を10万ドル以上下回る可能性があるが、これは誰も達成していない生産規模を前提としている。私が目にするロボティクスの提案の多くは、この計算を曖昧にしている。
社会的受容性は、エンジニアがしばしば過小評価する基準だ。人間の創造性やつながりが本質的な価値を提供する領域(料理、育児、芸術)では、ロボットによる代替は純粋な経済性を超えた文化的抵抗に直面する。倉庫や製造現場にはそのような障壁が少ない。価値提案は能力と同じくらい重要だ。
第二の道筋:インフラを構築する
第二の道筋は、技術スタック自体、つまりハードウェア(ハンド、アクチュエーター)またはインテリジェンス(基盤モデル、制御システム)を進化させることだ。ここでの機会は、テスラやFigureのような垂直統合型プレーヤーだけでなく、より広範な市場にサービスを提供する水平的インフラを構築することだ。
Physical Intelligenceは、「脳」が最も価値のある層であるという賭けに6億ドルを調達した。つまり、あらゆる身体に宿ることができるハードウェア非依存のAIだ。しかし基盤モデルはデータ制約に直面している。現在のオープンソースロボティクスデータセットは、合計で約5000時間のインタラクションデータしかない。画期的とされるDROIDデータセットは、18の研究室、50人の収集者、12カ月を要してわずか350時間の多様な操作データを生成した。
これは興味深い問いを示唆している。大規模なロボティクスデータ収集の解決は、モデル自体の構築よりも防御可能なのだろうか。あるいは制御層を考えてみよう。これらのモデルはすべて軌道を出力するが、実行は断片化されたままだ。「モデルが望むこと」と「ハードウェアが行うこと」の間に、汎用コントローラーの余地はあるだろうか。
正直な不確実性
戦略的選択は、市場がどのように進化するかに依存する。ロボティクスはスマートフォンのように階層化するのか(プレミアムと低価格帯が共存)、自動車のように収束するのか(プレミアムが時間とともに低価格化)、それとも検索のように統合されるのか(データフライホイールによる勝者総取り)。
私には決定的な答えはない。しかし10億ドル規模の機会は、見出しを追いかけることからは生まれないと信じている。それらは技術を深く理解し、市場構造を正直に理解するエンジニアから生まれる。つまり、真に未解決で広範な適用可能性を持つ特定のボトルネックを特定できる人々からだ。
最終的に、この競争は印象的なデモでは決まらない。長時間のシフトで働き、安価にサービスを受け、実際の施設で価値ある作業を一貫して実行するロボットによって決まる。それらが我々が注力すべき領域だ。



