2026.01.05 20:56

AIが実験段階から本番フェーズへ：現在を形作る6つの潮流

Anirudh Pupneja | Contributor

著者フォロー

記事を保存

stock.adobe.com

アニルド・ププネジャは、YCが支援するスタートアップRedaptoの共同創業者です。

現在の状況を見ると、AIを取り巻く物語は再び変化しています。私たちはもはやモデルに単に行動を要求するだけではありません。基本的なスケーリング法則への大規模な回帰、消費者向け「スーパーアプリ」の台頭、そしてエンジニアリングの聖杯とも言える学習と自己修正が可能なエージェントの出現を目の当たりにしています。

AIに関しては、実験段階から本番フェーズへと移行していると私は考えています。以下が、この時代を特徴づける興味深いパターンです。

1. 大手研究所の巻き返し

最近のトレンドの中で、これは最も重要な修正の一つだと感じています。一時期、巨大企業には収穫逓減の法則が働くかもしれないと思われていました。しかし実際には、スケーリング法則がいまだに有効で適用可能であることが証明されています。

この変化を最もよく表しているのは、2025年11月のGoogleによるGemini 3のリリースでしょう。「Deep Think」機能の導入と世界クラスのモデル配信により、これらの大企業が確実に復活していることが示されています。最先端の戦いは均衡状態になりました。巨人たちは眠っていません。彼らはスケールしているのです。

2. OpenAIと「万能アプリ」

同時に、OpenAIは消費者市場に向けて積極的な転換を図っています。「スーパーアプリ」戦略の出現が見られます。これには、2025年9月にリリースされて以来、100万ダウンロード以上を記録したSora 2も含まれます。

ソーシャルダイナミクスに関しては、OpenAIエコシステム内のグループチャットがプラットフォームをソーシャル化しようとしています。そしてエージェント型コマース分野では、ShopifyやEtsyなどのプラットフォームとのパートナーシップが大きな転換を表しています。

パターンが再び浮上しているのが見て取れます。これらのテクノロジーは、コンテンツ作成からコマースまでをカバーするエージェントを配置し、日常生活のオペレーティングシステムとなることを目指しています。

3. オープンソースが本番稼働可能に

前述の通り、私たちは試行錯誤の段階を過ぎました。現在、オープンソースモデルの広範な本番デプロイメントが見られます。

Theory Venturesによる最近の「AI in Practice」調査によると、現在使用されているモデルの約70%がオープンソースです。このエコシステムは実用性で繁栄しています。CognitionによるSWE-grepやCursorによるComposerなどのイノベーションは、開発者のワークフローを再定義しています。また、GLM-4.6やKimi K2 Thinkingからの主要リリースは、プロプライエタリなベンチマークに匹敵するか上回っています。

一般的なタスクにおけるプロプライエタリモデルの優位性は狭まっています。これにより、大手研究所はさらに最先端を追求して関連性を維持することを余儀なくされています。

4. 「AI既存企業」のジレンマ

興味深いことに、スタートアップエコシステム内にも「既存企業」が現れ始めています。わずか3年前に創業した企業が、現在では困難な「中間領域」に位置し、構造的には以前のAI環境向けに構成されたままになっています。

パターンは変化しました。今日では、プラットフォーム全体を刷新する準備が必要です。エージェントをファーストクラスの市民として扱い、その能力から逆算して設計することが目標であるべきだと私は考えます。真のエージェンシーを持たない古い「チャットボット」アーキテクチャに固執していると、エージェントネイティブな未来に向けて構築する新興企業に食われるリスクがあります。

5. 聖杯：自己改善型エージェント

これはおそらく最も重要なトレンドです。開発者たちは、機械学習のような継続的学習を模倣するシステムを構築しています—これは否定できないユーザーの要求に応えるものです。

AIを使おうとする非技術者に尋ねれば、誰もが同じフィードバックをくれるでしょう：「情報や修正フィードバックを与えても、忘れてしまう。何も起こらない」

この問題を解決するための初期の変化が見られます：

• メモリレイヤー： 過去のやり取りを考慮したより良いコンテキスト保持。

• プロンプト最適化： Genetic-Pareto（GEPA）のような技術が大きな注目を集めています。アグラワルらによる2025年7月の研究で詳述されているように、このアプローチによりシステムは自身の軌跡を「振り返り」、大規模な再トレーニングなしでプロンプトを最適化できます。

• ポストトレーニング： トップスタートアップ企業は、単にユニットエコノミクスを向上させるだけでなく、特定のタスクでのパフォーマンスを最大化するためにポストトレーニングに移行しています。

しかし、課題は残っています。強化学習（RL）でこれをスケールするには、検証可能なドメインが必要です。適切なスコアリング関数と、軌跡を数学的に修正する能力が必要です。出力を検証する方法がなければ、人間による実験に頼らざるを得ません。

6. ループ内の人間

もちろん、最大の実存的変化は人間の役割に関するものです。この軌道を続けた場合、私たちは何をするのでしょうか？

OpenAIの「プロジェクト・マーキュリー」に初期の兆候が見られます。このプロジェクトでは、100人以上の元銀行家や金融専門家を採用しています。これは会計に関するものではなく、データに関するものです。これはラベリング企業や専門家との深いパートナーシップと競合します。企業は価値ある専門家レベルのフィードバックを得るために、新しいAIスタートアップとの深いパートナーシップを切望しています。

問いかけは厳しいものです。私たちは人間からのフィードバックによる強化学習（RLHF）のための機械になるのでしょうか？私たちは単に、自分たちが作成したモデルの宿題を採点するだけの存在なのでしょうか？