【重要なお知らせ:当社を装った偽サイトにご注意ください】

AI

2025.01.30 18:30

DeepSeekを疑うOpenAI、学習に用いたという技術「蒸留」とは?

Koshiro K / Shutterstock.com

Koshiro K / Shutterstock.com

OpenAIによると、中国のスタートアップ企業DeepSeekが、自社の人工知能モデルから生成された出力を使用して新たなオープンソースモデルを訓練した可能性があるという。ファイナンシャル・タイムスの報道によれば、このモデルは米国時間1月27日に多くの関係者を驚嘆させ、米国の金融市場を動揺させた。OpenAIは、DeepSeekが最新のモデルを構築する過程で一部のデータを利用したと考えている。
 
ChatGPTを開発したOpenAIはファイナンシャル・タイムスに対し、DeepSeekが「蒸留(distillation、ディスティレーション)」と呼ばれる手法を用いて自社のデータにアクセスした可能性を示す証拠を確認していると述べた。蒸留とは、大規模かつ高度なAIモデルが出力した結果を使って、より小型のモデルを訓練・改善する技術である。

ブルームバーグによれば、OpenAIと主要支援企業であるマイクロソフトは、DeepSeekがOpenAIのAPI(他社が同社のAIモデルにアクセスする手段)を利用して蒸留を実施したかどうかを調査しているという。

ファイナンシャル・タイムスの報道では、両社は昨年APIを使っていた複数のアカウントを調査し、蒸留に関わる規約違反の疑いで遮断したとしている。これらのアカウントはDeepSeekに属するとみられている。

この問題は、ドナルド・トランプ大統領の「AI担当官」に任命されたデイビッド・サックスが初めて指摘した。同氏はフォックス・ニュースで「DeepSeekがOpenAIモデルの出力を蒸留したという実質的な証拠がある」と述べ、「OpenAIはこの事態を快くは思っていないはずです」と付け加えた。

サックスはさらに、「今後数カ月のうちに、米国の主要AI企業が蒸留を防止するための措置に乗り出し、こうした模倣モデルの一部は確実に減速するでしょう」と語った。

ホワイトハウスでも本件が国家安全保障上の懸念を引き起こしたとされ、国家安全保障会議(NSC)が影響を精査している。報道官のカロライン・レビットは「これは米国のAI業界に対する警鐘です」とコメントしている。
次ページ > 蒸留とは何か、対抗策はあるのか

翻訳=酒匂寛

タグ:

ForbesBrandVoice

人気記事