如何在电网承载范围内实现AI的大规模部署
为AI供电对电网造成了巨大压力。 Image: Unsplash/Joshua Sortino
- 大规模部署AI需要大量建设数据中心,以满足运行AI所需的的计算能力要求。
- 随着全球AI需求不断增长,电网负载也随之加重,人们担心需求可能很快将超过供给。
- 开发超高效率的AI正是科技行业反复遇到的挑战,其基础是多层次的连续研究和创新。
没人知道生成式人工智能(GenAI)革命对社会和全球经济的影响具体有多大。如果所有夸张的预测都是准确的,那么生成式人工智能将推动生产力和创新实现巨大飞跃。不过,预测成真的前提是一切进展顺利,最可能出问题的是能源。大规模部署AI需要大量建设数据中心,以满足运行AI所需的的计算能力要求。
随着AI需求增长,电网负载也随之加重。研究人员和各国政府预测,在两到三年内,全球电力需求可能超过供给,导致运营受限,每个人的电费更高。
AI使电力需求快速增长
常规的AI部署已经使数据中心的电力需求飙升。以英伟达GPU为基础的单个机架每天耗电达120千瓦时,相当于4.5个美国家庭的用电量。这看似不多,但当数千个数据中心内安装了数十万这样的机架,电力需求就会迅速增长。
高盛在2024年5月的一项估算显示,到2030年,仅AI就将使每年的电力需求增加约200太瓦时。作为对比,纽约市每年的用电量约为55太瓦时,相当于每天约10000吉瓦时。若高盛的预测准确,AI将给美国电网增加相当于三个纽约市的电力需求。
显然,我们需要更多电力。微软、亚马逊和谷歌等最大的一些公司正在收购或新建自己的核电站,以确保未来供电。这对于有资源的组织来说是一个明智之选,但大多数组织没有这样的资源。对我们其他人来说,公司利益相关方和政府决策者必须共同努力,找到增加电力容量和改善电网的最佳途径。
在代理型人工智能(Agentic AI)的驱动下,所有这些AI部署都将极大地提升生产力。代理型人工智能通过自主智能体完成任务,并相互协作,几乎不需要或完全不需要人工干预。这种人工智能将推动AI运行负载比例的变化。2023年,训练占用了AI运行负载的大部分,与推理的比率约为2:1。正在形成的共识是,到2025年,随着智能体的普及,推理负载将与训练负载大致持平,而在明年,推理将以越来越大的优势成为主要的AI工作负载。
电力需求将超过供给
实现这一转变所需的计算能力和电力将远超以往任何时期。在全球许多地区,这一需求将超过当前电网的发电或输电能力。最近在美国、欧洲和亚太地区的估算表明,在数据中心高度集中的地区,例如最常提及的美国北弗吉尼亚,电力需求将在两到三年内超过供给,除非对电网和发电能力进行重大投资。这将导致一些数据中心无法满负荷运行,其他数据中心的建设可能推迟,同时可能导致所有人的电费上涨。
或者,情况会有所不同吗?SambaNova将自研的芯片集成到硬件平台,其性能是基于GPU解决方案的十倍,而耗电量仅为十分之一。更高效的芯片和硬件方案为讨论如何在AI发展的过程中提高其效率提供了切入点。
要让AI取得成功,其开发、部署和交付公司必须更加智能和高效地利用现有的电力。这需要整个AI生态系统采取一些新方法。
提高AI效率的方法
在过去一年中,开源模型(如Meta的Llama)为公司打造定制化模型带来了可能。这些预训练模型可以免费下载,根据现有的大量数据进行微调,并与更小型的专业模型结合。它们一直在不断提升,并很快将与专有基础模型达到同等水平。开源模型帮助组织绕过了昂贵且高能耗的模型训练过程,直接微调和部署属于自己的可持续改进的模型。
此外,充分利用已部署的硬件也十分重要。由多个公司(其中一些是初创公司)组成的强大的生态系统正带头采用基于软件的创新型优化方案,以确保最高效的AI运行负载。这不仅能降低整体运营成本,还有助于减少公用电网的电力负载。
最后,我们可以将所有这些方法、开源模型以及在全面优化的环境中运行的更高效的硬件相结合。这将提升AI的生产力,同时充分利用现有的电力。
开发超高效率的AI正是过去几十年来科技行业反复遇到的挑战,其基础是多层次的连续研究和创新。实现这一目标需要采取多方面的方法,我们可以共同努力。
本文作者:
Rodrigo Liang,SambaNova联合创始人兼首席执行官
本文原载于世界经济论坛Agenda博客,转载请注明来源并附上本文链接。
翻译:狄陈静
编辑:王灿
不要错过关于此主题的更新
创建一个免费账户,在您的个性化内容合集中查看我们的最新出版物和分析。
许可和重新发布
世界经济论坛的文章可依照知识共享 署名-非商业性-非衍生品 4.0 国际公共许可协议 , 并根据我们的使用条款重新发布。
世界经济论坛是一个独立且中立的平台,以上内容仅代表作者个人观点。
实时追踪:
电力
分享:
每周 议程
每周为您呈现推动全球议程的紧要问题(英文)