米政府のデータベースによると、スケールAIはこれまでのところ、防衛関連の契約から6060万ドルの収益を得ている。同社は昨年、2億4900万ドルの防衛関連契約を受注したとプレスリリースで言っているが、米国防総省によると、スケールAIはこの契約を受注した70社以上の企業のうちの1社に過ぎない。
同社はこれまで最大1500万ドルの契約を1件受注しているが、支払いはまだ実行されていない。米政府のAI関連支出の最大の分け前にあずかっているのは、いまでもノースロップ・グラマンやロッキード・マーティンといった大企業であり、シリコンバレーのスタートアップではないのだ。
「そういった企業は、生成AIの理解という点では最先端ではありません」とワンは言う。彼にとって、政府との提携は長期戦なのだ。米国防総省はすでに、ウクライナの衛星画像が示す戦略的な意味を理解するためにスケールAIの専門知識や技術を利用しているが、それは始まりに過ぎない。
ワンいわく、生成AIはいずれ、もっと包括的に利用されることになる可能性がある。米国の現役軍事要員130万人から集めたライブデータをもとにカスタムAIモデルを訓練すれば、戦争の本質を変えることになるかもしれない。
ただし、そこに到達するのは容易ではない。生成AIモデルは、先行のAIモデルよりはるかに複雑な学習を必要とし、人間の手助けを必要とするが、それは単にインターネットからデータをかき集めてラベルづけするような作業ではなく、もっと複雑なプロセスだ。なぜ子犬がかわいいのかを、AIに人間の耳にしっくりくるように説明させるためには、人間が自然な言い回しをAIに教える必要がある。
「人間が注釈をつけたデータは、AIモデルの性能に極めて大きな影響を及ぼすことがわかっています」と、オープンAIの競合でトロントを拠点にするCohere(コヒア)の共同創業者エイダン・ゴメスは語る。スケールAIは、同社にとって最大のカスタムデータの提供業者となっている。
しかし、すべてのAI企業がスケールAIを買っているわけではない。例えばオープンAIは、スケールAIの人間のラベルづけ作業員に頼っているが、データの管理には自前のソフトウェアを使う選択をしていると、同社の共同創業者のヴォイチェク・ザレンバは述べている。
また、著名なAI企業でスケールAIに仕事を依頼した経験をもつ3人のエンジニアリング部門の幹部が、同社が提供する人間が作成した訓練データの質には気がかりな点があると、フォーブスにひそかに明かしている。ひとりは、あるテキストベースの生成AIモデルで、ラベルづけ作業員の英語力が乏しかったために支障が出たと語った。「スケールAIのデータの質は高いこともありますが、いつもそうだとは言えません」と別のひとりも話す。
これに対し、スケールAIの広報担当者は、「私たちは自社の製品とその結果に責任をもっています」と述べている。