海外

2026.04.29 17:00

次世代AIの新たな学習データは、昨日消えたスタートアップのSlackとメール

stock.adobe.com

AI研究所はインターネット上の公開データを2024年後半に使い切り、実務データに活路を求める

AI研究所はかつて、掲示板Redditのスレッドやウィキペディアの記事、電子化された書籍などのインターネット上の公開データを使ってモデルを訓練していた。だが、OpenAIのチーフサイエンティストだったイリヤ・サツケバーによれば、そうしたデータは2024年後半までにほぼ出尽くした。しかも、このような公開データのみでは、職場で使用される「エージェント型AI」のモデルの構築にはあまり役立たないという。

advertisement

一方で、cielo24のような役目を終えた企業が、日々の仕事の中で人の手で残してきた業務データは、AIエージェントにとって実務能力を鍛えるための重要な学習素材になっている。職場で通用するAIの能力を高めようとするなら、仕事をこなすとはどういうことかを示す実例が大量に必要になるからだ。

「モデル開発企業は、モデルを正確にテストするには、現実世界の業務環境にあるノイズが必要だと気づき始めている」とアリ・アンサリは語る。彼が率いるmicro1は、AI研究所向けに「Roots」という製品を販売している。これは、金融サービスや複雑なスケジュール管理といったタスクでAIエージェントが腕を磨けるようにした、仮想の持ち株会社(ホールディング・カンパニー)だ。

SimpleClosureや競合Sunsetは、廃業企業の社内データを買い取って転売

SimpleClosureのCEO、ドリ・ヨナによれば、AI企業から寄せられる業務データへの関心は、「常軌を逸したレベル」に達しており、同社にとって追い風になっている。「こうした企業は、まるでゴールドラッシュのように、現実の業務データに飛びついている」とヨナは語る。

advertisement

需要の高まりを受けてSimpleClosureは、事業をたたむ企業が保有するコードやSlackのアーカイブ、メールなどを売却できる場として、「Asset Hub」の立ち上げを進めている。ヨナによれば、Asset Hubはまだ一部がベータ版の段階にある。社内データから個人を特定できる情報を削除する工程は、機密性が高く、技術的にも難しいためだ。同社は、より広く展開する前に、この仕組みを「万全な状態」にしておきたい考えだという。

ヨナによれば、SimpleClosureはこの1年で、事業を終えた企業向けに100件近い取引を手がけてきた。創業者のために回収した金額は合計で100万ドル(約1億5900万円)超にのぼり、1社当たりの支払額は通常1万〜10万ドル(約159万〜1590万円)だという。

一方、競合のSunsetも、同程度の価格帯で、事業を終えた企業のデータを買い取っている。同社のCEOのブレンダン・マホニーはフォーブスに対し、価格は企業の規模や設立からの年数に加え、「データの豊かさ」によって決まると語った。これは、データの中身をどこまで追跡できるか、また異なるプラットフォーム間のデータがどれだけ結び付いているかを示す尺度だという。たとえば、特定のコードコミットとひも付いたJiraのチケットは、単独のドキュメントよりも価値が高いとマホニーは説明した。医療や金融のような業種のデータには、より高い値が付きやすいと付け加えた。

次ページ > 社内データの売却はプライバシー侵害にあたると専門家が指摘

翻訳=上田裕資

タグ:

advertisement

ForbesBrandVoice

人気記事