11月12日,AMD正式发布第二代AMD Versal Premium系列产品,并为用户提供早期文档。
据AMD自适应和嵌入式计算事业部(AECG)高级产品线经理Mike Rather介绍,第二代AMD Versal Premium系列产品共有2VP3102、2VP3202、2VP3402、2VP36024种产品,逻辑单元从140万到330万不等,DSP引擎从3332到7616,应用处理器均为具有48KB/32KB L1缓存、支持奇偶校验和ECC、1MB L2缓存的双核Arm Cortex-A72,实时处理器均为具备32KB/32KB L1缓存、支持ECC 256KB TCM的双核Arm Cortex-R5F,GTM2收发器从32到72,此外还有PCIe和CXL器件、100G多速率以太网MAC与600G以太网MAC,以及400G的高速加密引擎和LDPC的解码器。
AMD Versal Premium系列架构概览
根据AMD的计划,今年第四季度提供功率估算工具,2025年下半年提供全套的AMD Vivado工具。2026年上半年将提供芯片的样片以及开发套件,2026年中实现芯片量产。
初识:第二代AMD Versal Premium系列产品
第二代AMD Versal Premium系列产品,基于已经量产一年的第一代产品AMD Versal架构的成熟解决方案而构建,以低风险整合新架构模块扩展了第一代AMD Versal Premium系列的极限硬IP集成。
需要指出的是,第一代产品AMD Versal的所有单元块在第二代里都是复用的设计。再加上AMD针对I/O、收发器以及存储/内存的控制器、主机的接口展开的创新,这样的开发模式能够保证推广部署非常顺利并迅速实现过渡。
第二代AMD Versal Premium系列六大技术创新
从产品架构图可以看出,第二代AMD Versal Premium系列其DSP计算密度实现了更高的每平方毫米DSP算力、高DSP与LUT比率,引入的新的128G收发器,其协议覆盖范围从1.25G-128Gb/s线速;在IO方面,增加了对高速MIPIC-PHY( 10Gbps)、MIPI D-PHY ( 4.5 Gbps)接口的支持,内存采用DDR5-6400及LPDDR5X-8533,至多8个控制器、CXL存储器扩展模块,PCle Gen6与CXL 3.1,双 x8主机接口、集成DMA,PCle完整性与数据加密,内联DDR加密与ECC,安全性得到了进一步的强化。
这六大创新,赋予第二代AMD Versal Premium系列三大特征。
深度了解:三大特征
技术的发展与应用的深入,沉淀出越来越多的数据,对基础设施在带宽、性能、效率以及环保、安全防护等方面的要求越来越高。在AI的迅速发展和重度使用下,这些挑战变得越来越重要。Mike Rather高兴地介绍说,第二代AMD Versal Premium系列充满了创新,这些创新体现在三个领域:加速主机连接、释放更多内存和加强数据安全。
AMD自适应和嵌入式计算事业部高级产品线经理Mike Rather
第二代AMD Versal Premium系列采用PCIe Gen 6和CXL 3.1,以64Gb/s的速率加速主机连接,在更快释放内存方面,LPDDR5X和DDR5分别以8533Mb/s、6400 Mb/s的速度提升这一进程,CXL存储器扩展模块支持更多的存储器接口,而在增强数据安全性方面,AMD增加了完整性和数据加密、硬内联ECC和加密用于DDR存储器;另外还有400G高速加密引擎确保网络安全性——这个最初是在第一代的Versal产品里就引入的。
1.加速主机连接
加速主机的连接对于高端计算应用非常关键。
在当下,DDR5已经成为行业最为广泛采用的主流趋势,连接CXL的内存未来5年也将有212%的年复合增长率,正在出货的服务器中半数已经提供对CXL的支持。从架构的角度,这些都意味着更快的主机连接、更多的内存以及更加连贯的接口。
采用PCIe Gen 6、LPDDR5X和CXL 3.0等逐步支持这些趋势的架构,就显得越来越重要了。
AMD在Versal Premium自适应SoC和AMD EPYC CPU之间能够形成非常好的协同。PCIe Express提供Versal Premium和CPU之间非常高性能的连接,可以用于卸载计算、网络以及存储工作负载,还拥有非常连贯的接口,这样Versal Premium和EPYC处理器就能够共享内存空间,从而减少搁置内存,再加上PCIe IDE以及内存DRAM的加密,数据能够做到端到端的安全性。
第二代AMD Versal Premium系列产品还提供一个叫做GTM2的新的收发器,它不仅能够结合第一代Versal Premium产品上的两个收发器GTM与GTM1使用,还支持从1.25Gb/s到128Gb/s的数据速率以及NRZ和PAM4编码,实现数据流最大化,同时,AMD也保留了非常熟悉的设计流程,支持开发者使用GTM2,并确保全过程的可靠性。
2.释放更多内存
人工智能应用的不断深入,导致数据总量越来越多,因此,更快速释放更多内存也非常重要。第二代AMD Versal Premium系列产品通过在DDR5和LPDDR5上支持,数据传输速率是第一代产品支持的DDR4和LPDDR4的2倍,消耗的功率下降了20%~30%,硬内联ECC与加密加强了内存保护。
通过对CXL 3.1规范设计的遵从,第二代AMD Versal Premium系列产品可以兼容多数DRAM供应商,实现内存的增加,同时,LPDDR5X使得总可用存储器带宽至高可达到256x 8.533 Gb/s,使用两个8道CXL的连接,速率可以达到64Gb/s。通过这样的架构,从外部存储器的带宽可以超过500Gb/s。
3.端到端安全性
在不断恶化的安全形势下,增强数据安全性正变得日益重要。
第二代AMD Versal Premium系列产品提供了PCIe IDE加上高速加密引擎、DDR内联加密与ECC,确保数据无论是在传输中、静态中还是使用中都,具有非常高度的安全性,堪称全球唯一基于灵活应变平台的400G高速加密引擎。
专属开发的应用场景
Mike Rather介绍了第二代AMD Versal Premium系列的专属开发应用场景。
1.CXL 3.1释放更多内存
在扩大数据中心的CXL范围领域,第二代AMD Versal Premium系列不仅可以扩大内存,还可以提供高性能的内存接口。CXL 3.1使用PCIe Gen 6协议,比CXL 2.0高出一倍的带宽,利用NUMA,可轻松与现有的软件集成。
第二代AMD Versal Premium系列支持CXL.io、CXL.mem、CXL.cache,因此在器件模式方面,Versal Premium可以作为内存控制器,支持Type-1、Type-2、Type-3 | DCOH,在主机模式方面,支持Type-3 | 本地代理。这样就可以连接之前给大家展示过的CXL扩展模块。实际应用过程中,既可用于内存池和分层、多主机单逻辑设备(MH-SLD)架构,还可支持邻存计算与系统可组合性。
2.自适应网络用于GPU集群和横向扩展
适应人工智能的需求,很多客户都已经购买并部署GPU的集群,而标准的网络接口却未必能够支持在这样情境下GPU的性能和灵活性。第二代AMD Versal Premium以很高的带宽和灵活性,满足了这方面的应用需求。这是多年前AMD在Virtex UltraScale+和第一代Versal Premium上都支持过的。不同的是,第二代AMD Versal Premium系列能够在单个网络适配器上支持2个400G接口。
3.测试与测量:推进下一代协议
时下大众感兴趣的开发PCIe Gen 7器件以及下一代MIPI摄像机等测试仪要求128Gb/s的收发器以提供高吞吐量和采样率,要求高DSP与逻辑密度,以适用于紧凑型设备,要求CXL 3.1 存储器扩展、LPDDR5-8533以实现深度抓取,要求同一I/O上的D-PHY或C-PHY以便轻松交换测试模块……所有这些,也都是第二代AMD Versal Premium系列支持的。
第二代AMD Versal Premium系列产品适用于大数据量以及高计算密度的应用场景,包括数据中心、通信、测试与测量的场景。
在通信行业,支持6G RAN加速/AI、城域/核心交通、数据中心互联、安全设备;为数据中心提供计算加速、定制AI网络、计算存储、企业级SSD支持,在测试与测量方面,可用于PCle Gen7分析器摄像头传感器测试仪、无线测试仪、存储/CXL测试仪领域。
针对Versal产品组合的Vivado工具计划
每次Vivado版本发布,都为Versal用户带来工作效率的提升与良好应用体验。
Vivado是所有Versal器件统一的设计环境,提升Versal用户工作效率与应用体验。AMD不断地改善和优化这个环节,第二代AMD Versal Premium系列也不例外:首先,通过采用新的P&R算法、改善多线程的性能、增强的增量流的措施来减少编译时间;同时,AMD还引入了用于顶层设计、NoC2、GTM2的RTL流程,为开发人员提供友好型设计入口;第三,AMD还改善了质量结果,也即QoR与易用性,通过工具引导的时序收敛,改进的DFX流程以及分段配置,从而加快CPU启动时间和PCIe的唤醒。
关键:应对用户不断变化的需求
据了解,上一代AMD Versal Premium采用的是7nm制程,第二代Versal Premium更进一步,采用的是是6nm制程。AMD自适应与嵌入式计算事业部( AECG ) Versal产品营销总监Manuel Uhm介绍说,随着摩尔法则的衰减,制程的重要性越来越低,更重要的是架构,不可能像过去那样以一半的功耗达到双倍的性能;关键是取决于应用场景的需求。
Manuel Uhm强调:“AMD Versal Premium系列产品总是能够非常精准地去针对关键应用,确保能够有最合适的算力、I/O以及内存的组合,实现最高的性价比。”
的确,满足用户不断变化的需求,这才是最重要的。
- 联想百应智能体首发 AI赋能中小企业开源增效降本 – 2024年11月30日
- 首个国家级!中国气象局联合支付宝推出“中国天气”智能体 – 2024年11月29日
- 阿里云首次公开展示Flink2.0细节,将全面拥抱大模型技术 – 2024年11月29日