大约三年前,为 DeepSeek 母公司工作的中国人工智能工程师团队推出了一款早期的人工智能超级计算机,《华盛顿邮报》称该计算机是由从 Nvidia 购买的 10,000 个 A100 GPU 构建而成。大约六个月后,“华盛顿禁止 Nvidia 向中国出售更多 A100”,文章指出。当你阅读本文时,请记住这个数字。 10,000 个 A100 GPU…DeepSeek 的新聊天机器人本周在硅谷和华尔街引起了恐慌,导致股市蒸发了 1 万亿美元。这种影响在很大程度上源于该公司声称,其最新模型的训练成本仅为 560 万美元,并且仅使用了 2,000 块左右的 Nvidia 不太先进的 H800 芯片。周一,随着 DeepSeek 飙升至下载排行榜榜首,英伟达的市值暴涨 5890 亿美元,促使唐纳德·特朗普总统呼吁美国工业界“高度关注”竞争……但仔细观察 DeepSeek 就会发现,其母公司该公司在其超级计算机中部署了大型而复杂的芯片组,专家们评估该项目的总成本远高于美国市场本周反应的相对微不足道的成本…… Rand 表示,DeepSeek 对[早期]超级计算机的明显访问将使该公司更容易开发更高效的模型,需要更少的芯片。该文章称,早期的项目“表明 DeepSeek 取得了重大进展……”,“其技术可与美国领先的人工智能公司相媲美。”尽管 DeepSeek 声称只花费了 560 万美元来训练其一个先进模型,但“其母公司表示,建造早期的超级计算机花费了 10 亿元人民币,即 1.39 亿美元。”)然而,该文章还引用了周五的最新见解芯片投资公司 SemiAnalysis 总结了他们的发现,DeepSeek“在 GPU 上花费了超过 5 亿美元,总资本支出近 13 亿美元”。文章指出,OpenAI 首席执行官 Sam Altman 周四表示,DeepSeek 的能源效率声明“被过分夸大了……这是我们很久以前就有的能力水平的模型”。 Palmer Luckey 称 DeepSeek 在 X 上“确实令人印象深刻”,但称 560 万美元的培训成本数字“虚假”,并表示硅谷的崩溃是“歇斯底里”。专家表示,即使考虑到总成本较高,美国公司对 DeepSeek 颠覆市场的担忧也是正确的。民主、社会与新兴研究所的人工智能专家 Kai-Shen Huang 表示:“我们确信有两件事:一是 DeepSeek 的服务定价非常有竞争力,二是其模型的性能可与领先竞争对手相媲美。” Technology,一家位于台北的智库。 “我认为 DeepSeek 的定价策略有可能扰乱全球市场……”中国更广泛的人工智能政策推动帮助创造了有利于像 DeepSeek 这样的公司崛起的环境。北京于 2017 年公布了雄心勃勃的人工智能蓝图,目标是到 2030 年成为全球人工智能领导者,并承诺为大学和私营企业提供资金。全国各地的地方政府都纷纷推出了自己的支持人工智能的计划。
在 Slashdot 上阅读这个故事的更多内容。