Anthropic 泄露了中国的 AI 公司如何从 Claude 窃取数据以打造自己的大型语言模型(LLM)!



在此之前,我想提醒您几天前我曾发过一篇帖子,内容是:“从 API 使用量来看,全球前五大 AI 公司中有四家由中国掌控。中国制造的 AI 模型输出接近 Claude,API 费用大约比它低 8-10 倍。这也是它们的模型在行业层面如此广泛使用的原因。”但他们是如何实现这一能力的呢?

让我们一探究竟。

DeepSeek、Moonshot AI、Kimi 和 MiniMax 这些公司被 Anthropic 指控,他们对 Claude 模型进行了工业级的提取攻击。也就是说,他们试图完全复制 Claude 的高级能力,然后用这些复制品训练自己的模型。为此,他们开了大约 24,000 个虚假账户,与 Claude 进行了超过 1600 万次互动。目标是掌握 Claude 的高级推理能力、代理行为、编码技能和工具使用。

DeepSeek 通过大约 15 万次互动,试图通过提示活动逆向推导出 Claude 的内部逻辑或逐步推理过程。甚至还将 Claude 用作自己模型的输出评判系统!另一方面,Moonshot AI 仅在代理推理和工具使用方面进行了大约 340 万次互动的复制。最激进的是 MiniMax,进行了约 1 亿 3000 万次互动,主要集中在编码和编排方面。有趣的是,当 Anthropic 发现并封锁他们时,他们会在 24 小时内迅速切换到一个新的 Anthropic 模型,重新开始数据提取。

这些行为都是经过精心策划和去中心化操作的。为了规避检测,他们采用轮换 IP、共享支付方式,以及在数千个账户之间同步活动。这一系列操作已经发展到,据说是迄今为止最大规模的 AI 模型蒸馏行动。

背后的地缘政治背景也相当有趣。不久前,OpenAI 向美国政府提交了一份备忘录,警告说中国实验室正间接试图获取美国前沿模型的访问权限。

但问题是,他们窃取如此大量的数据后会做什么?
答案是:利用 Claude 的高级数据,增强自己的模型。这么庞大的数据处理需要巨大的数据中心和超级计算机,而这会消耗大量电力。令人惊讶的是,仅在 2025 年,中国就新增了超过 500 吉瓦的电力容量,几乎是美国的十倍!

也就是说,他们通过从美国 AI 模型中提取数据,已经将自己的 AI 基础设施推向了工业级别。到目前为止,涉事的这三家中国 AI 公司都没有公开否认数据窃取的指控。
查看原文
post-image
post-image
此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见声明
  • 赞赏
  • 评论
  • 转发
  • 分享
评论
0/400
暂无评论
交易,随时随地
qrCode
扫码下载 Gate App
社群列表
简体中文
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)