DeepSeekは、最新モデルの訓練コストが560万ドル(約8億7000万円)だったと述べているが、これはアンソロピックのダリオ・アモディCEOが2024年に述べた、1億ドル(約155億円)から10億ドル(約1550億円)というモデルの訓練費用を大きく下回る。
DeepSeekが12月に発表したV3モデルの開発には、約2000台のエヌビディア製チップが使用されたとされるが、これは米国企業が同じサイズのモデルを訓練するために必要とする数万台のチップに比べてはるかに少ないとWSJは指摘した。また、UCバークレーの研究者が主催するプラットフォームであるChatbot Arenaの分析によると、V3とR1モデルは1月25日時点でチャットボットの性能面でトップ10にランクインしていると同紙は報じている。
創業者はヘッジファンド出身
英紙フィナンシャル・タイムズ(FT)によると、DeepSeekのCEOを務める梁文峰(Liang Wenfeng)は、80億ドル(約1兆2000億円)を運用するヘッジファンド、High-Flyerの創業者で、AIチップを使用して株価を予測していたとされる。彼は、2023年にDeepSeekを設立し、「チップの動作を深く理解している卓越したインフラチームを構築した」と、FTは報じた。米国政府は、エヌビディアの最先端チップであるH100を中国へ輸出することを禁止したが、これにより中国のAI企業は、より性能の劣るエヌビディアのH800を用いて、限られた計算能力に対処する方法を模索せざるを得なくなった。しかし、FTの記事によれば、梁のチームは「この問題の解決方法をすでに知っていた」という。
DeepSeekの性能については、マイクロソフトも感銘を受けている。同社のサティア・ナデラCEOは22日の世界経済フォーラムで、「DeepSeekの新モデルを見ると、推論時の計算効率が非常に高く、オープンソースモデルとして非常に効果的だ」と述べた。彼はまた、「中国におけるAI開発の進歩を非常に真剣に受け止めるべきだ」とも語った。
DeepSeekの成功がエヌビディアの今後の成長の妨げになるのかどうかは不明だが、企業がコストを抑えた生成AIモデルを求めていることは明らかだ。今後、より多くのスタートアップがDeepSeekの成功を再現すれば、エヌビディアの最も高価なチップへの需要が減少する可能性がある。
(forbes.com 原文)