每瓦TOPS达3倍!AMD推出第二代Versal自适应SoC,为AI推理提速

芯东西(公众号:aichip001)
作者 |  ZeR0
编辑 |  漠影

芯东西4月9日报道,今日,AMD推出第二代Versal自适应SoC产品组合,包括面向AI驱动型嵌入式系统的第二代Versal AI Edge系列、面向经典嵌入式系统的Versal Prime系列。

每瓦TOPS达3倍!AMD推出第二代Versal自适应SoC,为AI推理提速

第二代Versal自适应SoC采用下一代AI引擎AIE-ML v2,通过扩展数据类型能够实现高达2倍的TOPS/W、高达10倍的标量计算,为嵌入式系统带来单芯片智能性。

每瓦TOPS达3倍!AMD推出第二代Versal自适应SoC,为AI推理提速

上一代做AI引擎控制主要通过可编程逻辑来实现,而这一代被结合在了AI引擎的阵列中,并做了硬化,节约出的可编程逻辑能够被用于做传感器和其他数据处理的应用。

每瓦TOPS达3倍!AMD推出第二代Versal自适应SoC,为AI推理提速

从第二代Versal AI Edge系列器件中的Dense情况来看,当数据类型是MX6,最高端可达370TFLOPS;如果是INT8,最高端可做到184TOPS。如果采用稀疏度,性能可以翻倍,高端器件达到近370TOPS。采用AIE-ML v2还可以做一些数据信号处理,比如FIR、FFT等。

每瓦TOPS达3倍!AMD推出第二代Versal自适应SoC,为AI推理提速

AI推理面临吞吐量大、精准度要求高等挑战。第二代Versal AI Edge系列器件现可支持更多的数据类型,也就能支持不同程度的精准度和吞吐量。有了新的数据类型支持,比如共享指数数据类型MX6、MX9,可在提高吞吐量的情况下不减损精准度。

每瓦TOPS达3倍!AMD推出第二代Versal自适应SoC,为AI推理提速

AMD提供了Vitis AI开源软件包,以便开发者使用熟悉的开源工具,如PyTorch、TensorFlow等,在Vitis中优化,然后进行AI推理。

每瓦TOPS达3倍!AMD推出第二代Versal自适应SoC,为AI推理提速

与此同时,第二代Versal自适应SoC能够为复杂的后处理提供高达10倍的标量算力,有高达8倍的Arm Cortex-A78AE核心,每核心最高频率达2.2GHz,并有高达200.3K的DMIPS算力。

每瓦TOPS达3倍!AMD推出第二代Versal自适应SoC,为AI推理提速

针对控制功能的实时处理单元,RPU可以有高达10倍的Arm Cortex-R52核心,每核心最高频率高达1.05GHz,并有高达28.5K的DMIPS算力。

考虑到边缘对信息安全与功能安全的严格要求,第二代Versal AI Edge自适应SoC将通过车规级认证和安全认证,支持汽车领域的ASILD和工业领域的SIL3。

AMD自适应与嵌入式计算事业部(AECG) Versal产品营销总监Manuel Uhm认为,未来的模型可能是现在根本没想到的,快速变化的行业需要非常灵活的、具有可伸缩性的平台,为此AMD提供从最低端到最高端的系列平台,能够有足够的适应性和灵活性,来帮助客户适应不断变化的市场。

“我们最大的优势就是能够把可编程逻辑的优势去融合到一个芯片中。”他谈道,AI推理过程通常使用矢量处理器,后处理阶段一般使用高性能嵌入式CPU,还要在预处理阶段加上FPGA和SoC进行优化,采用多芯片解决方案会带来巨大开销,现在这三个阶段的加速通过单一器件就可以实现。

每瓦TOPS达3倍!AMD推出第二代Versal自适应SoC,为AI推理提速

他总结说,第二代Versal自适应SoC系列产品推出的目的是用卓越的集成来降低系统的功耗占板面积与复杂性,即可以将多个器件通过单芯片智能来实现,带来更小、更高效的嵌入式 AI 系统。

每瓦TOPS达3倍!AMD推出第二代Versal自适应SoC,为AI推理提速

在这个过程中,安全功能得到加强,不需要采用外部的安全微控制器,或外部内存需求能降到最低。

每瓦TOPS达3倍!AMD推出第二代Versal自适应SoC,为AI推理提速

由图可见,其第一代产品和第二代产品是没有任何交叉的,第一代产品更多是边缘传感器或计算的卸载,不是中央计算,第二代产品可以说是一代产品的补充,针对不同的应用。

斯巴鲁下一代EyeSight视觉系统将采用第二代Versal AI Edge系列产品。EyeSight系统集成于部分斯巴鲁车型中,用于实现先进安全功能,包括自适应巡航控制、车道保持辅助以及预碰撞制动。

每瓦TOPS达3倍!AMD推出第二代Versal自适应SoC,为AI推理提速

第二代Versal自适应SoC早期试用计划现已展开,正与主要客户进行接洽,早期访问文档现已发布,AMD预计将在2025年上半年提供芯片样片,年中推出评估套件和系统模块(SOM),年末提供量产芯片。