海外

2026.04.29 17:00

次世代AIの新たな学習データは、昨日消えたスタートアップのSlackとメール

stock.adobe.com

社内データの売却はプライバシー侵害にあたると専門家が指摘

この種の資産売却をビジネスチャンスと捉える人がいる一方で、プライバシー上の懸念を指摘する声もある。Center for AI and Digital Policyの創設者であるマーク・ローテンバーグは、「たとえ従業員が業務で作成した資料の知的財産権を会社側に譲渡していたとしても、それで雇用主が社内のやりとりを第三者に売ってよいことにはならない」と指摘する。なぜなら、従業員の多くは、自分のSlackのメッセージがこのような形で再利用されるとは想定していないはずだからだ。

advertisement

「ここには、かなり重大なプライバシーの問題があると思う。従業員のプライバシーは依然として大きな懸念材料だ。とくに今では、多くの人がSlackのような社内メッセージツールに大きく依存している。これは単なる一般的なデータではない。個人を特定できる情報を含んでいる」と、ローテンバーグは語った。

ローテンバーグの団体は4月14日、上院商業委員会に書簡を送り、個人データを保護するための安全対策に懸念があるとして、米連邦取引委員会(FTC)に新たなAIビジネス慣行を精査するよう求めた。

匿名化処理には限界があり、学習データに含まれた情報がモデルから漏れる恐れ

こうしたデータを買い取る企業はどこも匿名化を重視していると説明しているが、データ業界に長く携わってきた関係者によれば、そのプロセスは決して単純ではない。キャリアを通じて蓄積された仕事の記録にひも付いた個人情報を、スイッチ1つで切り離せるわけではないからだ。

advertisement

現実世界のデータをめぐる複雑な規制や法務対応に特化した企業Protegeのボビー・サミュエルズは、「匿名化が不十分だった場合、データにアクセスした企業が、特定の組織や個人の活動を把握できてしまうリスクがある。このようなデータの取り扱いが杜撰だった場合、その内容がモデルの出力としてリークされる可能性がある」と語った。

また、問題は匿名化だけにとどまらない。個人のチャット履歴がAIモデルによってそのまま吐き出される恐れもある。OpenAIやGoogleを含む研究機関が2020年に発表した研究では、大規模言語モデル(LLM)が学習データ内のシークエンスを意図せずそのまま記憶し、適切なプロンプトを与えればそれを引き出せてしまう可能性が示されていた。

「強化学習ジム」市場は急拡大し、Anthropicは投資に約1590億円を検討

こうした実際の企業データへの需要の高まりを受けて、生まれたのが「強化学習ジム(reinforcement learning gym)」と呼ばれる新たな業界だ。この分野の企業は、消滅した企業のデータを使って、AIエージェントが実際の職場に近い環境で訓練できる模擬環境の構築に特化している。The Informationによれば、Anthropicは2026年、この強化学習ジムに10億ドル(約1590億円)を投じることを検討している。この市場は巨大ビジネスへと成長しつつある。

この分野ではすでに約50社の新興スタートアップが立ち上がっている。これまで収益の大半を、人間に報酬を支払って作成した学習データから得てきたMercorやmicro1のようなデータラベリング企業も、この市場に参入し始めている。事情に詳しい関係者によれば、一部の強化学習ジムのスタートアップは、すでに高い評価額を獲得している。Prime Intellectの評価額はすでに10億ドル(約1590億円)を超えており、The Informationによれば、Fleetも7億5000万ドル(約1193億円)の評価額で資金調達を協議中という。Prime Intellectはコメント要請に応じなかった。

AfterQueryは仮想業務環境を販売、AIエージェントに同僚の誕生日企画など雑務を訓練

AfterQueryという企業は、「ビッグ・テック・ワールド」や「ファイナンス・ワールド」「タックス・ワールド」といったパッケージ化された仮想業務環境をAI研究所向けに販売している。これらの環境では、AIエージェントがデジタル上のオフィス内を動き回り、模擬的なユーザーエージェントとやりとりしながら、現実世界の問題を解決する訓練を積む。

そこで与えられるタスクは、中間管理職が押し付けられがちな雑務そのものだ。たとえばAIエージェントは、ボブという同僚の誕生日会を企画するよう任される。ところが、そのAIは、別の同僚もすでに同じ準備を進めていることを知らない。しかも、ボブの誕生日がいつなのかも把握していない。課題をこなすには、ほかの従業員にメッセージを送り、情報を集めたうえで、相手と協力して進めるのか、それとも当初の計画を取りやめるのかを判断しなければならない。

こうして見ると、Slack上の一見無駄に思えるやり取りこそが、実はあなたがしてきた仕事の中で、最も長く残るものになるのかもしれない。ただし、AIモデルがあなたに関する社内データを細かく学習しすぎれば、ボブの誕生日を忘れていたのが誰だったのかまで、次世代のオフィスワーカーにうっかり漏らしてしまうかもしれない。

forbes.com 原文

翻訳=上田裕資

タグ:

advertisement

ForbesBrandVoice

人気記事