ビラル・アスマトゥラー氏は、長期的な科学研究を加速するエージェント型AIシステムを構築するSciloopの共同創業者である。
2025年秋、私と共同創業者が競争率の高いスタートアップアクセラレータープログラムに採択されたとき、私たちは野心的なアイデアを掲げていた。機械学習研究のための「AI科学者」を構築することだ。当初は機械学習に絞ったプロジェクトとして始まったが、すぐにはるかに大きな問いに直面することになった。AIが科学そのものを有意義に加速させるには、実際に何が必要なのか、という問いである。
2022年末にChatGPT(チャットGPT)がリリースされたとき、エッセイのアイデアを下書きするには適したツールだと感じたが、複雑な数学の問題には苦戦していた。それから2年後、私が確率・統計の入門コースを受講していたとき、教授がクラスに「問題集でAIが役に立ったと思う人は手を挙げて」と尋ねたことを覚えている。100人以上の学生がいるクラスで、手を挙げたのはわずか3、4人だった。私自身は使っていたので、役に立つと感じた学生がこれほど少ないことに驚いた。
しかし、私の考えでは、これらのシステムにとっての知能の聖杯は、国際科学オリンピアードの問題を解く能力だった。私自身が国際物理オリンピアードに出場した経験から、これらの競技は機械知能の有意義な上限を示していると長く信じていた。国際物理オリンピアードで金メダルを獲得することは、汎用人工知能(AGI)、つまり人間より賢いAIを創造するための北極星のように感じられた。なぜなら、世界で毎年わずか約40人の高校生だけが、何年もの厳しいトレーニングを経てこれを達成するからだ。
現在、一部のAIモデルは国際数学オリンピアードのトップ学生と同等の成績を収めているが、生物科学、材料科学、エネルギー研究といった分野でAI主導のブレークスルーを通じて可視化されるはずのAGIは、まだそこにない。
AIで科学的ブレークスルーを生み出すことが困難な理由
最難関のオリンピアード問題を解けるAIであれば、当然、新たな科学的ブレークスルーを生み出し、研究者に真の「ひらめき」の瞬間や、彼らが決して考えなかったであろう方向性を提供すると思われるかもしれない。しかし、今日に至るまで、慎重に演出された少数の事例を除いて、これは実現していない。しかし、オリンピアードのベンチマークで生のパフォーマンスを最適化することは、より深く根本的な問題を覆い隠している。
ほとんどの科学的ブレークスルーは、明白でも直線的でもなく、既存のデータから明確に導き出せるものでもない。それらは、高い確信を持った逆張りの賭けと、正しいと証明されるまでは間違っているように見える決断を必要とする。正しい道は、答えから1回の推論で導き出せることはめったにない。それは探索、失敗、修正を通じて現れる。
現代のAIシステムは、ワンショット推論、つまり質問に答える、モデルを適合させる、データセットを分析することに優れている。しかし、タスクが数週間または数カ月にわたり、あらゆる段階で不確実性を伴う場合、その能力ははるかに低い。言い換えれば、長期的な科学的推論に苦戦する傾向がある。
生物科学では、この限界は特に顕著である。この分野はしばしば「データが豊富」と表現されるが、生物学実験の約70%は再現性がない。問題は単にデータの不足ではなく、実験がどのように実施され、記録されるかという性質にある。最も価値のある科学情報の多くは、公表された論文や構造化されたデータベースに記録されることはない。それは電子実験ノート、スプレッドシート、PowerPointのスライド、そして最も重要なことに、実験者の頭の中に存在している。
実験を行う生物学者は通常、決断に影響を与えたすべての直感、環境観察、微妙な調整を記録しない。プログラマーがすべてのコード行に内部的な推論をコメントしないのと同様に、実験科学者は、なぜある方向を放棄して別の方向を追求したのかを常に記録するわけではない。
その結果、最終結果のみで訓練されたAIシステムは、科学を明確な最適化問題として見るが、実際には、それは判断の連続、失敗した試み、部分的な洞察の混沌としたシーケンスなのである。
AIが進化を続ける方法
AIシステムに長期的な推論をさせたいのであれば、結果だけでなく、軌跡、つまり仮説、実験、失敗、調整、放棄という完全な弧で訓練する必要があると私は考えている。
私は、いくつかの主要なAI研究所がこれらの限界を認識し、明確なオリンピアード形式の問題でモデルを訓練することから、オープンエンドな科学研究をより適切に反映する、より厳格なベンチマークへと移行し始めているのを目にしている。私の見解では、これらの新しいベンチマークは、実際の科学的作業が要求する曖昧さ、反復、長期的な推論を捉えることができる。
この野心はスタートアップやAI研究所に限定されない。米国エネルギー省が膨大な科学データセットを共有リポジトリに統合する取り組みを進めていることから、米国政府にとっても戦略的優先事項となっているようだ。これは、AI主導の科学的発見における米国の地位を強化するためである。
これが企業にとって意味すること
AIの推論能力向上の勢いと、科学のためのAIへの焦点の絞り込みを考えると、私は2026年がAI誘導型科学的発見のタイムラインにおける重要な節目になると楽観視している。
AIを導入するリーダーにとって、重要な示唆は、モデルが失敗するのは知能が欠けているからではなく、訓練のインセンティブが不整合であるか、単に多くの最先端AI研究所の焦点にまだなっていないからだということである。オリンピアードレベルのパフォーマンスは、これらのシステムが私たちが要求する多くの形式的スキルを習得できることを示唆している。今日のAIの領域固有の限界を恒久的なものと解釈するリーダーは、それらを過渡的なものと認識するリーダーに後れを取るリスクがある。
私の推奨は、最先端のAIの取り組みが最終的にあなたの関心領域と一致する瞬間に向けて、ビジネスを思慮深く位置づけることである。長期的なタスクにわたる意思決定がどのように行われるかを文書化し、人間とAIの協働のためのワークフローを構造化することを検討してほしい。これにより、AI能力が進歩したときに、組織が迅速に適応できるようになる。



