中国初创公司DeepSeek 的新聊天机器人打破了科技界及其他领域对人工智能成本的假设,如今正震撼另一个行业:能源公司。
该公司表示,它使用大约 2,000 块 Nvidia 芯片开发了开源 R1 模型,这仅仅是训练类似程序所需计算能力的一小部分。
这不仅对开发人工智能的成本具有重大影响,而且对作为这一不断发展的行业的核心的数据中心的能源也具有重大影响。
人工智能革命的前提是计算和能源需求将呈指数级增长,从而导致对数据中心及其供电方式进行大规模技术投资,从而提振能源库存。
数据中心容纳了运行人工智能应用程序的高性能服务器和其他硬件。
那么 DeepSeek 是否能代表一种耗电量更少的人工智能发展方式呢?
投资者似乎是这么认为的,周一,他们纷纷抛售美国能源公司的股票,并拖累了已经因科技股大规模抛售而受到重创的股市。
计划为人工智能建设大规模能源产能的 Constellation Energy 股价下跌逾 20%。
金融服务公司晨星的能源和公用事业策略师特拉维斯米勒写道:“R1 说明了计算效率的提高对发电机构成的威胁。”
他补充道:“我们仍然相信数据中心、回流和电气化主题仍将是顺风。”
但“市场预期过高。”
根据国际能源署 (IEA) 的数据,仅在 2023 年,谷歌、微软和亚马逊就向数据中心投入了相当于美国 GDP 0.5% 的资金。
国际能源署表示,数据中心已占全球电力使用量的约 1%,并产生了类似数量的能源相关温室气体排放量。
尽管数据中心的需求不断增长,但效率的提高迄今为止已经缓和了能源消耗。
但国际能源署预测,到明年,全球数据中心的用电量可能会比 2022 年的数字翻一番,达到日本年消耗量的水平。
这种不断增长的需求分布并不均衡。
根据美国能源部委托编写的一份报告,到 2023 年,数据中心将占美国电力消耗的 4.4% 左右,到 2028 年这一数字可能达到 12%。
去年,亚马逊、谷歌和微软都达成了核能交易,无论是所谓的小型模块化反应堆还是现有设施。
与此同时,Meta 签署了可再生能源合同,并宣布正在寻求核能供应提案。
不过目前,数据中心通常依赖严重依赖化石燃料的电网。
数据中心还会消耗大量的水,既有间接用于发电的水,也有直接用于冷却系统的水。
惠灵顿维多利亚大学人工智能高级讲师安德鲁·伦森说:“建设数据中心需要在钢铁生产过程中消耗大量碳,还需要大量碳密集型采矿和生产过程来制造满足数据中心需求的计算硬件。”
“因此,如果 DeepSeek 能够取代 OpenAI 等模型……那么能源需求就会净减少。”
然而,技术效率的提高往往只会导致需求的增加——这一命题被称为杰文斯悖论。
“杰文斯悖论再次来袭!”微软首席执行官萨蒂亚·纳德拉周一在 X 上写道。
他补充道:“随着人工智能变得越来越高效和普及,我们将看到它的使用量猛增,使其成为一种我们无法满足的商品。”
Lensen 还指出,DeepSeek 采用“思路链”模型,由于它使用多个步骤来回答查询,因此比其他模型更耗能。
这些系统以前的运行成本太高,但现在由于效率的提高而变得更受欢迎。
Lensen 表示,DeepSeek 的影响可能是帮助美国公司了解“如何利用计算效率来构建更大、性能更好的模型”。
“我认为,他们不会将模型缩小 10 倍并提高其性能,而是会利用新发现,让他们的模型在能耗相同的情况下更加高效。”