AMD超越30x25目标,树立雄心勃勃的20倍能效新目标

《AMD超越30x25目标,树立雄心勃勃的20倍能效新目标》

概览:

  • AMD 已超额完成其30×25目标,将AI训练和HPC计算的节点级能效提升了38倍,与五年前的系统相比,相当于同等性能下能耗降低97%。
  • AMD 设定了新的2030年目标,即以2024年为基准,将机架级能效提升20倍,使目前需要超过275个机架的典型AI模型到2030年只需在一个机架内即可完成训练,耗电量减少95%。
  • 结合软件和算法方面的进步,新的目标可使整体能效提升高达100倍。

在AMD,能效一直是我们路线图和产品战略中的核心设计指导原则。十多年来,我们制定了公开、有时限的目标,以大幅提升产品的能效,并始终如一地实现并超越这些目标。今天,我很自豪地宣布,我们再次做到了,并正在制定下一个五年节能设计的愿景。

在今天的Advancing AI上,我们宣布AMD已经超越了在2021年制定的30×25目标,即从2020年到2025年将AI训练和高性能计算(HPC)节点的能效提高30倍。这是一个雄心勃勃的目标,我们很自豪能够超额完成它,但我们不会止步于此。

随着人工智能规模的不断扩大,以及我们迈向真正端到端的全AI系统设计,我们比以往任何时候都更需要继续保持在节能设计领域的领先地位。正因为此,我们今天也将目光投向一个大胆的新目标:以2024年为基准,到2030年,将用于AI训练和推理的机架级能效提升20倍。

在十年领先地位的基础上再接再厉

这标志着我们在数十年间致力于提高整个计算平台能效的第三个重要里程碑。2020年,我们超额实现了25×20的目标,在短短六年内将AMD移动处理器的能效提高了25倍。在此势头之上,便是针对加速节点中AI和HPC工作负载的30×25目标。如今,到2030年实现机架级20倍能效提升的目标反映了下一个前沿领域,不仅着眼于芯片,还关注更智能和更高效的系统,从芯片到整机架集成,以满足数据中心级别的电力需求。

超越 30×25

我们的30×25目标源自于一个明确的基准,即与2020年基准年相比,将加速计算节点的能效提升30倍。这一目标意味着,与过去五年(2015-2020年)的行业趋势相比,能效提升2.5倍以上。截至 2025 年中,我们已超越这一目标,在四块AMD Instinct GPU和一颗第五代AMD EPYC CPU的当前配置下,相较基准系统实现38倍的能效提升。与五年前的系统相比,这相当于在相同性能下能耗降低97%。

《AMD超越30x25目标,树立雄心勃勃的20倍能效新目标》

我们通过深度架构创新、积极优化每瓦性能以及对CPU和GPU产品线进行不懈的工程设计实现了这一目标。

AI时代的新目标

随着工作负载规模和需求的持续增长,节点级效率提升将无法跟上步伐。最显著的效率影响可以在系统级实现,而这正是我们2030年目标的重点。

我们相信,从2024年到2030年,我们可以将AI训练和推理的机架级能效提升20倍。AMD 估计,这将比2018年至2025年的行业提升趋势高出近3倍。根据我们最新的设计和路线图预测,这反映了整个机架的每瓦性能提升,包括 CPU、GPU、内存、网络、存储和软硬件协同设计。这种从节点到机架的转变得益于我们快速发展的端到端AI战略,也是以更可持续的方式扩展数据中心AI的关键。

实践中的意义

机架级效率提升20倍,几乎是之前行业效率提升率的3倍,意义重大。以2025年典型AI模型的训练为基准,这些提升可以实现:

•将机架数量从超过275个整合到少于1个已充分利用的机架

•运营用电量减少95%以上

•模型训练产生的碳排放量从约3000公吨二氧化碳减少到100公吨二氧化碳

这些预测基于AMD芯片和系统设计路线图以及能效专家Jonathan Koomey博士验证的测量方法。

Koomey 博士表示:“通过将2030年目标建立在系统级指标和透明方法的基础上,AMD正在提高行业标准。机架级效率的目标提升将使生态系统中的其他各方,从模型开发者到云服务提供商,更能够可持续、更具成本效益地扩展AI计算。”

放眼硬件之外

我们的20倍目标体现了我们直接掌控的领域——硬件和系统级设计。但我们知道,随着软件开发人员不断探索更智能的算法,并以目前的速度继续使用低精度方法进行创新,AI模型的效率将有可能实现更大提升,在目标期内最高可达5倍。将这些因素纳入考量,到2030年,典型AI模型训练的整体能效将提升100倍。

虽然 AMD 并未宣称在我们自己的目标中已实现如此高的倍增,但我们很自豪能够提供实现这一目标的硬件基础,并支持致力于实现这些提升的开放生态系统和开发者社区以实现这些收益。无论是通过开放标准、AMD ROCm的开放软件方案,还是与合作伙伴的密切合作,AMD 始终致力于帮助世界各地的创新者更高效地扩展AI规模。

下一步行动

我们以30×25为上一个篇章画上句号,并以全新的机架级目标开启下一章,我们将继续致力于透明、责任义务和可衡量的进展。这种方式使AMD脱颖而出,而且对于我们如何在AI需求和部署不断扩展的背景下推动行业效率提升也必不可少。

我们很高兴能够不断挑战极限,不仅仅是性能的极限,还有以效率为主导的无限可能。随着目标的推进,我们将继续分享进展情况以及这些成果对整个生态系统产生的影响。

【本文作者Samuel Naffziger, AMD高级副总裁兼企业院士】

点赞

发表评论

邮箱地址不会被公开。 必填项已用*标注