OWOW(OWOW)の共同創業者兼CEOであるガンゲシュ・パタク氏による寄稿。
AIはかつてないスピードで成長しており、より大規模なモデル、より大きなデータセット、そしてより強力な計算能力を備えています。しかし、見出しの裏側には、私が見てきた中でしばしば見過ごされる問題があります:多くのAIシステムが偏向した、浅く、ノイズの多いデータで訓練されているという事実です。その結果、モデルはデモでは人々を満足させるものの、実生活では実用的ではありません。
もしAIを応用するために必要な要素が、より多くのGPUではなく、より多くの人間の専門知識だとしたらどうでしょうか?
多くの人が語らないボトルネック
AI駆動型採用プラットフォームの創業者として、私は人間のデータパイプラインと企業向けAIプロジェクトに直接取り組んできました。専門家からの入力の質が、モデルが単にデモで良い結果を出すだけなのか、それとも実際の世界で機能するのかを決定づけることを目の当たりにしてきました。
この経験を通じて、AIの規模が業界の議論の中心にあることも分かりましたが、議論ではしばしばAI開発の主要なボトルネックが見落とされています:モデルが訓練されるデータの質のレベルです。モデルに供給されるデータ入力が不十分な場合、モデルは指数関数的に拡大するリスクがありますが、パフォーマンスとアウトプットは低下します。
AIの機能不全は、公平で完全、または高品質な形でAIに供給されなかったデータによって引き起こされます。モデルはベンチマークを超える能力を持っていても、本番環境では失敗し、AIへの信頼を損なう可能性があります。言い換えれば、質の低いデータは質の低いAIにつながるのです。
なぜ人間の専門知識が重要なのか
マルチモーダルAI—テキスト、動画、音声、画像を処理できるタイプのAI—は、写真の中の猫を識別する以上のアノテーションを必要とします。大量のクラウドワーク—つまり最小限のトレーニングを受けた作業者にデータアノテーションを外注すること—では、医療記録、金融、多言語対話などの複雑なマルチモーダルAIシステムで必要とされるニュアンス、文化的感受性、専門知識のレベルを提供するのに苦労する可能性があります。
このようなギャップが最も脆弱な場所は、ビジネスのこれらの重要な領域にあります。AIは医療診断、金融、法律、さらには採用などの分野での人間の判断を代替することはできません。これらの領域は文脈的な認識を要求します。例えば、臨床アノテーションタスクには臨床の専門知識が必要です。金融コンプライアンスの判断には規制の枠組みの理解が必要になります。私の仕事の場合、採用システムはスキルを考慮するだけでなく、求人票に含まれる偏見も認識する必要があります。
人間の知性はアルゴリズムが提供できないものを提供します:深さ、文脈、専門知識です。人間がループに入らなければ、AIは差別、組織的な無能さ、全体的な不信感など、回避すべき本質的な問題を再現するリスクがあります。その結果、社会的・倫理的危険性と技術的無能さが生じます。
人間とインフラストラクチャーの融合モデル
私の見解では、AIとの未来は人間対機械ではなく、両者を活用するコラボレーションです。スケーラブルで本番レベルのAIには2つの基盤が必要です:人間の知識の既知の源泉と信頼性の高いデータインフラストラクチャーです。ドメイン専門家を使用して高性能なデータパイプラインにアノテーションを付けることで、これらのアノテーションは真実の表現となります。トレーニングデータはより豊かで、よりクリーンで、より信頼性の高いものになります。
トレーニングループに人間の判断を組み込んだモデルは、アルゴリズムの改善につながり、企業が単なるデモンストレーションのために生み出された一発限りのAIではなく、信頼性が高く大規模に機能できるAIシステムを構築することを可能にします。
この移行の最前線にある企業は、高コストで最大のモデルを追求しようとはしていません。彼らは人間参加型データに賭けており、AIと人間の専門知識を組み合わせてパターンを発見し、現実世界を理解することができます。
自社でこのアプローチを取るために、以下のステップをお勧めします:
1. アノテーションへの専門家の参加を確保する。 ドメインの専門家(例:臨床医、コンプライアンス担当者、業界専門家)がデータラベリングと検証プロセスに関与することが重要です。
2. データガバナンスインフラに投資する。 各トレーニング段階で品質チェック、公平性監査、文脈的検証を行うパイプラインを開発します。
3. 人間参加型アプローチを使用する。 AIワークフローは、AIが完全に独立していると想定するのではなく、専門家がアウトプットを改善しエッジケースを解決できるよう、継続的に人間の監督を含むように設計されるべきです。
重要性
これを正しく行うことの重要性は非常に高いです。もし私たちが表面的なデータでより大きなモデルを訓練するなら、AIはデモ技術になるリスクがあると私は考えています—バイラルな瞬間を作り出すことはできても、実用的な使用という重要な場面では失敗するような技術です。
企業が「人間とインフラストラクチャー」のアプローチを使用する場合、その利点は革命的です。私の見解では、AIには差別を排除して雇用を最大化し、より正確な医療診断をもたらし、複雑さを解明しつつ信頼性を維持する金融ソリューションを提供する可能性があります。
私が見るところ、規模はもはやAIの新たなフロンティアではありません。それは人間の経験の多様性に基づく情報です。そのようなシステムの基盤は、それを設計する人々だけでなく、それが奉仕する産業やコミュニティの知識と専門性にも依存しています。
AIの次の波を制する企業は、最大のモデルや最も強力な計算能力を持つ企業ではないでしょう。私は、それらが人間の専門知識とマルチモーダルデータインフラストラクチャーを活用して、強力かつ信頼性の高いシステムを作成する方法を学ぶ企業だと信じています。人間の知恵と機械のスケールを結びつける能力を持つ企業が、ブレークスルーが起こる場所になるでしょう。



