赛灵思推出新边缘SoC,每瓦特AI性能可达GPU的4倍

芯东西(公众号:aichip001)
编译 |  
高歌
编辑 |  
江心白

芯东西6月10日消息,今天,赛灵思推出了新的Versal AI Edge系列,这是一款自适应SoC,将主要在汽车、工业和医疗等领域中使用。

相较于其他的SoC,赛灵思Versal AI Edge主要具有三点优势,分别体现在单位面积功耗性能、计算密度和灵活性上。赛灵思称,Versal AI Edge的机器学习算力和单位功耗性能都是GPU的4倍,时延也更低。

当前,Versal Edge AI已经向客户提供了资料,计划在2021下半年为客户提供工具,并在2022年上半年提供早期试样和量产芯片。

赛灵思Versal AI Edge系列高级产品线经理Rehan Tahir分享了Versal AI Edge的具体技术细节,也与芯东西等媒体在会后进行了深度交流。

赛灵思推出新边缘SoC,每瓦特AI性能可达GPU的4倍▲Versal AI Edge的三大优势(来源:赛灵思)

一、AI引擎针对机器学习优化,单位功耗性能为GPU的4倍

Rehan Tahir提到,边缘端设备具有低时延、低功耗、安全保密等特性,可以解决云端薄弱点。据英国市场公司Omdia统计,边缘AI芯片市场正在迅速扩展,预计将于2025年达到650亿美元。届时,边缘AI芯片市场将会是数据中心市场的3倍左右。

而赛灵思Versal ACAP产品组合此前主要针对云与网络领域,并已完成了7nm节点的量产。本次,赛灵思则针对边缘市场推出了Versal AI Edge,这将在智能视觉、无人机、协作机器人、ADAS与自动驾驶、内窥镜、超声等应用中使用。

Rehan Tahir称,Versal AI Edge采用了AI引擎阵列,与英伟达的Jetson AGX Xavier GPU相比,具有4倍AI单位功耗性能的优势。这主要是因为赛灵思采用了专为机器学习优化的AI引擎。

赛灵思推出新边缘SoC,每瓦特AI性能可达GPU的4倍▲Versal AI Edge的AI引擎(来源:赛灵思)

在这款AIE-ML AI引擎中,其乘法器数量翻倍、INT8算力翻倍,原生支持INT4和BFLOAT16。与未经机器学习优化的AI引擎相比,AIE-ML的每颗核心可提供2倍INT8算力,4倍INT4算力和16倍的BFLOAT16算力,时延减半。

在内存方面,AIE-ML的数据内存从32KB提升到64KB,实现了存储本地化。

此外,赛灵思还提出了新的加速器RAM,该器件可以实现35GB/s的存储器带宽,取代了DDR存储AI计算数据或安全关键代码。与DDR4相比,RAM还可以提升20%的机器学习算力。

赛灵思推出新边缘SoC,每瓦特AI性能可达GPU的4倍▲Versal AI Edge的加速器RAM细节(来源:赛灵思)

Rehan Tahir提到,Versal AI Edge与英伟达Jetson AGX Xavier同为最优配置的情况下,Versal AI Edge的单位功耗性能是Jetson AGX Xavier的4.4倍。而在其他配置下,Versal AI Edge也占有功耗性能优势。

谈到数据如何得出时,Rehan Tahir补充说:“Jetson AGX Xavier的功率估算数据是由其总模块功耗减去存储器和I/O功耗得出的。”

赛灵思推出新边缘SoC,每瓦特AI性能可达GPU的4倍▲Versal AI Edge与英伟达Jetson AGX Xavier的单位功耗性能对比(来源:赛灵思)

二、单个芯片完成L3级半自动驾驶控制,计算密度达10倍

在具体应用中,相比赛灵思此前的Zynq产品,Versal AI Edge在算力、面积和功耗上都有很大的提升。

相比Zynq,Versal AI Edge的算力从4TOPS提升到了17.4TOPS,也支持8MP(百万像素)摄像头。此前需要3个Zynq芯片才能控制的系统,Versal AI Edge只需要单个芯片就能控制,缩小了58%的面积,功耗也有所下降。

赛灵思推出新边缘SoC,每瓦特AI性能可达GPU的4倍▲Versal AI Edge与上一代SoC的性能对比(来源:赛灵思)

据Rehan Tahir分享,Versal AI Edge可用于ADAS与自动驾驶的各个方面。Versal AI Edge系列能够令引擎匹配于算法,以标量引擎进行嵌入式计算、人机交互等;自适应引擎则支持汽车的各类传感器融合;智能AI、DSP引擎则可以进行AI推断、处理雷达/激光雷达等高级信号等。

目前,Versal AI Edge已通过最高等级的ISO 26262安全认证,也支持Caffe、TensorFlow、PyTorch等多款软件栈。

另外,在协作机器人和无人机场景中,Versal AI Edge也可以在有限的尺寸、功耗与热量管理条件下提供所需的AI算例,并支持多种软件栈。

赛灵思推出新边缘SoC,每瓦特AI性能可达GPU的4倍▲Versal AI Edge支持汽车、机器人及无人机软件栈(来源:赛灵思)

三、单架构支持全算力区间, 芯片硬件也可在线更新

在介绍了Versal AI Edge的性能优势和应用案例后,Rehan Tahir强调,Versal AI Edge是全球最灵活且可扩展的边缘平台。他提到,Versal AI Edge采用了特定领域架构(DSA),能够定制化AI、视觉、传感器等。

而且Versal AI Edge也是唯一一个支持从0-100+TOPS算力区间的边缘AI芯片。其他的平台都在部分算力区间上存在空白,需要多个芯片联动才能支持全算力区间。Versal AI Edge单一平台就可以满足客户的各类需求,可以使部署更加灵活,并在功耗和成本上更具优势。

赛灵思推出新边缘SoC,每瓦特AI性能可达GPU的4倍▲Versal AI Edge可扩展至所有算力区间(来源:赛灵思)

由于当前AI芯片迭代迅速,赛灵思也为Versal AI Edge提供OAT软硬件更新。Rehan Tahir称,与一般的软件、算法更新不同,Versal AI Edge可以对硬件进行在线升级,并重新配置,进一步提升了产品寿命。

Versal AI Edge也具备动态功能切换(DFx),可以在毫秒内切换功能,通过减少系统组件数量,降低功耗和成本。

最后,Rehan Tahir给出了Versal Edge AI的落地进展。因为Versal Edge AI是Versal系列的新产品,所以现在客户可以使用Versal AI Core ACAP VCK190评估套件进行原型设计,并在之后迁移到Versal AI Edge上。

结语:赛灵思Versal Edge AI抓住边缘市场关键

边缘AI芯片依靠其安全保密、无需上传数据等特性,在安防、自动驾驶和智能制造等领域快速发展。在逐渐成熟的边缘AI市场中,AI算力往往不是设备性能发展的瓶颈。相反,功耗、散热、成本成为了边缘设备最核心的问题。

最近,赛灵思针对边缘市场推出了多款产品。本次推出的Versal Edge AI则主打成本、功耗、可扩展等优势,抓住了边缘市场的关键。未来,该产品或许会在汽车、工业等领域发挥更大的作用。