AI

2026.05.02 14:00

AIは学習データを使い果たしつつある可能性、スタンフォード大学報告書が警告

stock.adobe.com

stock.adobe.com

AIにとって不可欠な燃料である「データ」が不足しつつある可能性がある。そう警告しているのはスタンフォード大学の新たな報告書だ。AIと大規模言語モデル(LLM)の導入は急速に広がっているが、AIモデルの訓練に使える実データは、今後6年以内に枯渇する可能性があるという。

advertisement

これは、過去1年のAI分野の主な動向を分析したスタンフォード大学の「2026年AIインデックス報告書」(2026 AI Index Report)が示したものだ。全体として、同報告書の執筆者らは、AIが雇用と生産性に与える影響について、明るい材料と懸念材料が入り交じっていると見ている。

差し迫るデータ不足への警鐘は昨年の報告書でも示されていたが、今回の報告書でも状況は変わっていない。今回の報告書は、産業界と学術界の主要な研究を集約したものだ。スタンフォード大学の共同執筆者らは、「AI研究者らは、大規模モデルの訓練に使える高品質な人間由来のテキストとウェブデータはすでに使い尽くされたと公に主張している。この状態はしばしば『ピークデータ』と呼ばれる」と伝えている。「このことは、これまでより大規模なデータセットに依存してきたスケーリング則(データ量や計算量などを増やすほど性能が上がるという経験則)の持続可能性をめぐり、業界全体の懸念を引き続き高めている」。

合成データを使っても、データ不足を完全に解決できるとは限らず、AIの性能の足かせになる可能性すらある、と執筆者らは付け加えている。「実世界のデータを使える量に限りがあることは、合成データ──AIシステムが生成したデータ──を使って後続モデルの性能を高められるのであれば、それほど大きな問題ではないかもしれない」と共同執筆者らは述べている。ただしリスクは、合成データが、より限定的な用途を除けば、AIを十分に支えられない可能性がある点だ。実データはなお、訓練データセットの一部として残す必要がある。しかし、「単にデータを増やせば、必ず性能向上につながるわけではない。事前学習の段階で、合成データが実データの枯渇を完全に補えるという決定的な証拠はまだない」。

advertisement

生産性をめぐる問題

同報告書の執筆者らは、AIがこれまでに生産性へ与えた影響についても疑問を投げかけている。生産性の向上は「狭い範囲のタスクでは測定可能だが、マクロレベルでの証拠はまだ初期段階であり、評価は分かれている」としている。「AIをめぐる経済圏は急速に拡大しているが、その成長がどれほど広く、またどれほどうまく実際の経済価値へ転換されるのかは、なお未解決の問題である」。

生産性向上は実際に見られるものの、効果にはばらつきがある。AIはカスタマーサポートやソフトウェア開発で14〜26%の改善を示しているが、ビジネス上の判断を要するタスクでは弱い。報告書によると、生産性向上が見られるのは、「構造化されている、言語処理の比重が高い、または明確なフィードバックの仕組みに支えられている」タスクである。「それ以外のタスクでは、ツールが業務に合っていない場合、効果は小さいか、場合によってはマイナスになる。」

AIによる生産性向上は、初級職の雇用が減り始めている分野で現れており、AI導入と人員削減の間に関係があることを示唆している。「研究によれば、カスタマーサポートとソフトウェア開発では14〜26%の生産性向上が示されている一方、より多くの判断を要するタスクでは効果が弱いか、マイナスになっている」。

次ページ > 雇用をめぐる問題、AIエージェントをめぐる問題

翻訳=酒匂寛

タグ:

advertisement

ForbesBrandVoice

人気記事