AI

2025.06.03 11:00

Snorkel AIが142億円調達 今やAIがネットを網羅、専門性高めた評価システム開発

T. Schneider / Shutterstock.com

ラベル付けのルールをプログラム(コード)として記述し、自動化

ラトナーによると、シュノーケルAIの差別化要因は、専門家を積極的に関与させるる独自手法「プログラマティック・ラベリング」を用いて、あらかじめ設定したキーワードや、ラベル付けのルール(条件)を短いプログラム(コード)として記述することで、大規模なデータに自動的にラベリングできる点にあるという。これは、医師や弁護士といった忙しい専門家が、手作業に頼ることなく、迅速かつ低コストでデータをラベル付けできるよう支援する手法だ。

advertisement

OpenAIやグーグルなど、フロンティアAIラボとも協力か

さらに、AIモデルの評価では、専門的な質問や指示に正確に応答できているか調査するために、高品質な問題集・模範解答にあたるデータ(評価用データセット)の生成が不可欠だ。そのためシュノーケルAIは、STEM分野の専門知識を持つ教授、弁護士、公認会計士、小説家といった数万人規模の熟練した契約者を雇用して、AIモデルを開発・改良している企業や研究機関向けの専門的なデータセットを作成している(これら企業や研究機関には、OpenAIやグーグル、アンソロピック、メタといった大規模かつ高性能なAI基盤モデルを手がけるフロンティアAIラボも含まれるようだが、ラトナーは具体的な名の明言は避けた)。

企業や研究機関は、この専門的なデータセットをもとに、AIチャットボットに新機能を追加したり、複雑な質問を細かく分解し推論したりするほか、あるトピックについて詳細な調査をできるようになる。

新旧の競合との競争に直面

しかし、このような専門的な領域の評価システムの構築に関しても、シュノーケルAIは新旧の競合との競争に直面している。

advertisement

例えばトップAI企業の多くは、自社モデルを評価するために、評価用データセットやオープンソースのデータセットを広く公開している。そのうちのひとつ、リーダーボード(ランキングサイトの一種)の「LMArena」は最近、独立企業としてスピンアウトし、著名投資家からシードラウンドで1億ドル(約142億円)を調達し、評価額が6億ドル(約852億円)に達したとブルームバーグは報じた。LMArenaは、「評価用データセット」と「評価指標」を公開し用いることで透明性を担保しており、異なるAIモデルを公平かつ客観的な基準で比較できるようになっている。加えて、スケールAIやチューリング、インビジブルテクノロジーズなどの企業も評価サービスを提供している。

それでもラトナーは、シュノーケルAIが「創業当初から人間の専門家を中心に据えていた点で他社とは異なる」と述べている。

AIがネット上のデータを吸収した中、専門家によるデータセットが成長

今回シリーズDラウンドに参加したグレイロックのパートナーのサーム・モタメディは、AI業界が「ポストトレーニング」(特定用途向けにAIモデルの性能を最適化・調整すること)に重点を移す中で、シュノーケルAIの「専門家がデータセットを作成するサービス」が急成長していると語る。

モタメディによると、AIがすでにインターネット上のほとんどのデータを吸収してしまった中で、一層価値を高めているのが「専門家がカスタムで作成するデータセット」だという。彼は「こうした市場の追い風は、彼らにとって極めて有利に働いている」と語った。

forbes.com 原文

編集=上田裕資

タグ:

advertisement

ForbesBrandVoice

人気記事