2024.07.30 08:00

学習データの不足に悩むAI企業を救う「合成データ」が抱える課題

Rashi Shrivastava | Forbes Staff

著者フォロー

記事を保存

著者フォロー

記事を保存

Shutterstock.com

人間の労働力を活用しデータ不足を解決

しかし、合成データにも課題が存在する。その1つは、元のデータセットのバイアスを誇張し、AIの幻覚をさらに悪化させる可能性だ。また、偽のデータで訓練されたモデルが新しいものを生成することができなくなることもある。ゴルシャンはこれを「死のスパイラル」と呼ぶが、一般的には「モデル崩壊」として知られている。彼は新たな顧客に対して、モデル崩壊を避けるために、質の高い実データの一部を提供するよう求めている。

データ不足の解決に向けたもう1つの方法は、人間の労働力の活用だ。一部のスタートアップは、既存のデータを整理しラベル付けを行って、AIにとってより有用にするために、もしくは新たなデータを生成するために、人々を雇っている。

データラベリング分野の巨人で評価額が約140億ドルのScale AI（スケールAI）は、OpenAIやCohere（コヒア）、Character AI（キャラクターAI）などのトップAI企業に、人間が注釈を付けたデータを提供している。同社はRemotasksという子会社を通じて、世界中で約20万人の労働者を雇用し、彼らに画像内の物体にボックスを描いたり、質問の異なる回答を比較してどちらがより正確かを評価するなどの作業を委託している。

さらに大規模なアプローチを取っているのが、アムステルダムに拠点を置くToloka（トロカ）で、同社は900万人の人間のラベラーや「AIチューター」をクラウドソーシングしている。これらのフリーランサーは、Hugging Face（ハギングフェイス）とServiceNow（サービスナウ）が主導するAIプロジェクトのために、データセット内の個人を特定できる情報にラベルを付けるなどの作業を行うが、新たな言語への翻訳や要約文の作成、音声の書き起こしなどを通じて新たなデータを生成する場合もある。

解決策は使用するデータの量を抑えること

トロカはまた、物理学の博士号を持つ専門家や科学者、弁護士などの専門家と協力して、特定の分野に特化したデータを作成し、ニッチなタスクをターゲットにしたモデルを訓練するためのデータを提供している。例えば、ドイツ語を話す弁護士を雇って、法的AIモデルに供給するコンテンツを作成する場合もある。

しかし、200カ国以上の人々を取りまとめ、彼らの作業が正確で信頼でき、バイアスがないことを確認し、学術用語をAIモデルが理解しやすい言語に翻訳するような作業には、膨大な手間がかかる。

次ページ＞「AI業界の人々は、モデルの構築は好きだが、人間を扱うことには慣れていない」

編集＝上田裕資

2025年6月号発売中

最新号の購入はこちらから定期購読のお申し込み

2025年6月号発売中

最新号の購入はこちらから定期購読のお申し込み

タグ：

FOLLOW US

Forbes JAPANの最新のニュースをお届けします

無料のメールマガジンに登録

視聴申込開始｜研究室からユニコーンへイベント第2弾は金融業界経験者に注目

多拠点サービス業の新スタンダード──。人の価値を創出する「サービステック」とは

多様性こそが競争力の源泉　三井物産女性活躍推進の軌跡

「テクノロジー×クリエイティビティ」で日本の魅力を創出——感動体験を追求するJ-CATの挑戦

不確実性の高い時代だからこそ、成果を出し続けられる「人間力」の育成を

AI、公共DX、サイバーセキュリティ…最先端な仕事を推進するEYストラテジー・アンド・コンサルティングのテクノロジー部門

進化を遂げたニューバランスの快適服「MET24」を、歌舞伎役者・中村歌之助が着こなす

自らのミッションで組織と共に成長する──多様な働き方が生むイノベーション

ゆるいつながりから変化への勇気が生まれる──。ワークスタイリングがつくる｢共感｣の力

【20名限定でご招待！】横浜でアシックスウォーキングの「GEL-BIZ シリーズ」を体験できるOCEANS×Forbes JAPAN コラボイベント

一生に一度の感動体験を。観光業を変革する挑戦者が見据える日本の未来

第1回「ピーステック・アワード」開催へ！テクノロジーで平和な未来を創るスタートアップを発掘・支援

視聴申込開始｜研究室からユニコーンへイベント第2弾は金融業界経験者に注目

多拠点サービス業の新スタンダード──。人の価値を創出する「サービステック」とは

多様性こそが競争力の源泉　三井物産女性活躍推進の軌跡

「テクノロジー×クリエイティビティ」で日本の魅力を創出——感動体験を追求するJ-CATの挑戦

不確実性の高い時代だからこそ、成果を出し続けられる「人間力」の育成を

AI、公共DX、サイバーセキュリティ…最先端な仕事を推進するEYストラテジー・アンド・コンサルティングのテクノロジー部門

進化を遂げたニューバランスの快適服「MET24」を、歌舞伎役者・中村歌之助が着こなす

自らのミッションで組織と共に成長する──多様な働き方が生むイノベーション

ゆるいつながりから変化への勇気が生まれる──。ワークスタイリングがつくる｢共感｣の力

【20名限定でご招待！】横浜でアシックスウォーキングの「GEL-BIZ シリーズ」を体験できるOCEANS×Forbes JAPAN コラボイベント

一生に一度の感動体験を。観光業を変革する挑戦者が見据える日本の未来

第1回「ピーステック・アワード」開催へ！テクノロジーで平和な未来を創るスタートアップを発掘・支援

人気記事

もっと見る