「当社はお客様から特定の情報を自動的に収集します。たとえば、IPアドレスや固有のデバイス識別子、Cookieなど、インターネットやその他のネットワーク活動に関する情報です。また、デバイスモデルやOS(オペレーティングシステム)、キーストロークのパターンやタイミング、IPアドレス、システム言語など、特定のデバイスおよびネットワーク接続情報も収集します。さらに複数のデバイスからログインした場合、デバイスIDやユーザーIDといった情報を用いてデバイスをまたいだお客様のアクティビティを特定し、シームレスなログイン体験やセキュリティ目的に利用します」
このように収集されるデータは、TikTokがかつて(あるいは現時点で)収集・共有していると疑われた情報よりも、はるかに重要なものだ。データがどこに送信されるのか、DeepSeekをオフラインで動かしてファイアウォールで保護できるかどうか、あるいはオープンソースのコード(ただし学習データは除く)を信頼できるかどうかにかかわらず、一度集められた情報は取り戻せない。国家の手に渡った強力なAIエンジンが、こうした個人を特定可能な情報をどう扱いうるかを想像してみるといい。
しかも、それらの情報はいっさいユーザーが暮らす国に保管されず、すべて中国へ送られる。企業がデータ収集に対して政府機関とあらゆる情報を共有する義務を負う国家安全保障関連の法律を抱え、世界各国でTikTokに関する政治的懸念を巻き起こしてきたあの中国だ。筆者はDeepSeekに対し、収集したデータがこれらの法律にどう関係するのか尋ねているが、まだ回答は得られていない。
今月、
Harmonic Securityは、ユーザーのプロンプトやアップロードを通じて生成AIプラットフォームが企業に巨大なリスクをもたらすと警告したが、その報告書を作成した時点ではDeepSeekほど露骨に高リスクな存在を想定していなかった。
DeepSeekはある意味、米国が「発明」させたものだ。DeepSeekは中国の投資会社から資金提供を受け、米国からの制限を受けてChatGPTのように高価なハードウェアを多数用いることが難しい状況で、同等の成果を出そうとしている。そのためにはイノベーションとさまざまな回避策が必要になったはずだ。