不发芯片发平台?阿里平头哥再放大招,RISC-V策略全解析!

智东西(公众号:zhidxcom)
作者 | 心缘
编辑 | 漠影

智东西8月24日报道,在今日举办的2022 RISC-V中国峰会上,平头哥半导体副总裁孟建熠公布了阿里平头哥的最新“造芯”力作——无剑600

这次,平头哥发的不是芯片,而是一个高性能RISC-V芯片设计平台。它一方面帮助芯片公司降低开发芯片成本和风险,另一方面向第三方IP和基础软件公司开放,让更多资源接入到RISC-V生态。

“无剑”是剑法的至高境界,也寄予了平头哥的雄心:通过“授人以渔”,提供软硬件全栈支持,显著缩短芯片从研发到量产的时间,推动更多面向不同行业的高性能RISC-V芯片出现。

更重要的是,它将长期活跃于终端市场的RISC-V芯片,送上了通往高性能的高速列车。

据孟建熠分享,无剑600已经实现与国产开源云端操作系统龙蜥的适配,并成功运行了大型桌面级软件和基于JAVA的应用。

一、“平台+SoC原型”双剑出鞘,突围高性能

近年起势迅猛的RISC-V,与x86、Arm一起,被业界并称为「三大CPU主流架构」。

因开源开放、灵活、低功耗等特性,RISC-V具备没有历史包袱、没有高昂授权费用、开发成本更低、无需担忧“断供”风险等优势,被视作发展自主可控本土芯片生态的关键路径之一。

平头哥在做的事,就是通过软硬件研发投入和生态连接,推动国内RISC-V生态快速壮大。

今天发布的无剑600,便意在于此。

无剑600是一个高性能RISC-V异构芯片的软硬件全栈平台,拥有高性能、高内存带宽、异构计算、人工智能(AI)加速的特点,同时兼具高安全、多模态感知和软硬一体的能力。

不发芯片发平台?阿里平头哥再放大招,RISC-V策略全解析!

▲无剑600平台设计图

借助该平台,开发者和企业能够快速开发性能更高、主频更高、内存更大、边缘AI计算能力更强的SoC芯片。

无剑600的默认处理器是玄铁C910,即平头哥在2019年发布的主频2.5GHz的高性能RISC-V核。

这将RISC-V的商用性能,从1GHz推向2GHz

有何意义?孟建熠打个比方,假如将RISC-V比作跳高运动,原来只能跳1米高度,现在能稳定跳2米以上,突破了RISC-V性能的极限。

在AI加速方面,无剑600平台中,最新版的玄铁C910集成了矢量Vector处理器,支持FP16等新型数据类型,并可提供高达4TOPs的Int8 AI算力,方便AI加速类应用的开发。

无剑600平台还重点实现了CPU+XPU异构架构设计,从运行功耗、内存带宽和软件栈方面都进行了优化,并支持适配GPU、NPU、VPU、DSP、ASIC等多种不同功能的第三方IP

也就是说,半导体IP公司可以用无剑600来打造RISC-V整体生态上的能力,下游厂商进入了系统级、体系化的框架,可更高效地开发芯片。

平头哥基于无剑600平台成功“打样”——SoC原型曳影1520

不发芯片发平台?阿里平头哥再放大招,RISC-V策略全解析!▲SoC原型曳影1520

这是一颗多模态AI处理器SoC,内置4核玄铁C910,最高吞吐率4266MT,AI峰值算力达到4TOPS,支持全链路安全防护,具有4K视频处理能力,同时包含丰富的异构计算和高速IO资源,软硬件都已完成应用的适配。

开发者和企业也可以在定制个性化芯片的同时,先在曳影1520上开发自己的系统,缩短产品从研发到量产上市的时间。

二、给软硬协同打个样!用RISC-V芯片跑大型桌面级软件

RISC-V芯片的参数迈进了高性能的大门,下一步,就是考察实际跑应用的表现。

在曳影1520上,平头哥与龙蜥社区、中科院软件所PLCT实验室,联合打造从芯片平台到龙蜥操作系统、再到上层应用软件的全链路能力,已首次实现龙蜥Linux操作系统的兼容。

不发芯片发平台?阿里平头哥再放大招,RISC-V策略全解析!▲基于龙蜥Linux OS的软硬件全栈平台

这进一步拓展了RISC-V生态想象力。

龙蜥操作系统(Anolis OS)是一款基于Linux的国产主流开源云计算操作系统,定位于服务器端,支持多种主流芯片架构和计算场景。

因其丰富、复杂的软件栈,龙蜥对芯片的要求非常高,此前在x86、Arm架构上都经过了全面验证。这一次,龙蜥首次对RISC-V提供全面支持。

曳影1520帮助RISC-V架构搭载更重的操作系统和应用,完成了3000多个基础组件的适配,并首次运行FireFox浏览器、LibreOffice等大型桌面级软件,以及Hexo和Open Rocket等基于NodeJS和JAVA的应用,这为更大型应用程序的适配奠定了基础。

不发芯片发平台?阿里平头哥再放大招,RISC-V策略全解析!▲图说:无剑600平台已适配龙蜥OS,并首次运行LibreOffice Writer/Impress/Calc等桌面级软件

这是无剑600平台的一小步,但是RISC-V的一大步。

全栈适配龙蜥,印证了无剑600平台能够适配主流云计算操作系统,并凸显了RISC-V可面向特定领域及应用进行深度定制化的软硬联合优化能力。

当前,无剑600平台针对的市场主要包括平板、智慧大屏、智能NVR、AR/VR和低速UGV等这类高性能旗舰级的产品,也支持医疗成像、视频会议、家用机器人、无人机等中高端应用。

基于无剑600平台现已能运行龙蜥社区的多种云上应用,OpenJDK、NodeJS、Python等上游社区常见应用,以及NCNN等AI应用。

三、夺榜权威AI基准测试,RISC-V架构创新加速端侧AI计算

实现高性能RISC-V芯片,非常考验芯片设计团队的功底,尤其体现在算力与内存、功耗、成本等多方面之间的平衡把握上。

孟建熠告诉智东西,如今下游合作伙伴已经不仅仅满足于一个硬件IP核,而更加看重软硬件能否很好融合、在稳定性和性能上都做出优势,这些需求的变化正推动市场往软硬件全栈方案发展。

以无剑600平台为例,从RISC-V处理器的指令设计、微架构实现、工具链和底层库的优化、操作系统优化适配,到应用的联合调优,平头哥团队都做了大量艰苦的研发工作,才在技术软件上达到基本稳定的量产水平。

打磨好这些基本功后,还要配置专业的团队,对特定应用领域所需的功能进行锤炼。

作为高性能RISC-V处理器的先行者,平头哥当前的策略是通用计算DSA(领域专用架构)并行演进。

AI加速是当前一大主流DSA方向。随着AI计算在端侧应用愈发普及,AI开发友好性正成为芯片的一大核心竞争力。国内很多硬件加速器已经能做到较高的性能,但输在“用不起来”。

而RISC-V的开放性,使其相较于Arm芯片有更大的底层创新和扩展空间,能设计出更适合跑AI算法的系统,并能兼顾到不断推陈出新的AI算法对灵活可扩展性的要求。

平头哥正通过矢量扩展和全链路软硬件能力的提升,持续优化其RISC-V处理器的AI加速能力。

今年4月,权威AI基准测试MLPerf Tiny V0.7推理性能榜单显示,基于平头哥RISC-V处理器的软硬件联合优化方案,在视觉唤醒、图像分类、语音唤醒、异常监测等4个典型端侧AI任务中均取得第一,遥遥领先于第二名。

不发芯片发平台?阿里平头哥再放大招,RISC-V策略全解析!▲平头哥在MLPerf Tiny V0.7测试拿下4个第一

平头哥近两年也在力推为RISC-V准备的AI部署工具HHB,它支持各种类型的模型和算法,通过更好地实现AI算子与硬件的适配,帮助开发者完成AI模型的高效编译及部署。

据孟建熠观察,对于1TOPs以下的端侧AI算力需求,平头哥现有的RISC-V处理器足以胜任,不需要再额外加专用加速器;对于超过1TOPs的算力需求,平头哥既提供基于RISC-V的扩展,也支持用户自定义的第三方AI加速IP。

例如在过去两年,平头哥与Imagination在GPU和AI方面进行深度合作,已经能提供硬件IP到优化的软硬件异构计算方案。这也是RISC-V领域最成熟的可量产的方案。

四、推动生态形成合力,三分天下有其一

孟建熠分享说,未来RISC-V将向3个必然趋势演进:高性能、软硬件全栈、更广的生态合作

如何构建更加繁荣的生态?俨然是当前RISC-V领域最核心的议题。

“统一形成好的生态,是大家做RISC-V的共识。”孟建熠谈道,RISC-V不是其它架构的革命者,当务之急是证明自己能够成长起来,发展出自己的特色,真正成为“三分天下有其一”的架构。

RISC-V处理器的作战阵地,正从中低端IoT市场,扩展对高性能、可靠性有更高要求的云计算、边缘计算、车载智能计算等应用场景。

过去一年,全球RISC-V生态进展飞速,并出现很多标志性事件:在IoT(物联网)领域的应用规模超过100亿颗,中国公司的出货量占到50%;SPECint性能首次超过10分,进入高性能计算的行列

平头哥也收获了显赫的战绩:玄铁处理器已成为国内RISC-V领域影响力和市占率最大的处理器,广泛应用于MCU、蓝牙、无线、语音、视觉等30多类场景,授权数以每年50%的数量增长。

但相比Arm逾2000亿颗芯片的出货量、几乎圈入全球主流科技公司的成熟生态,RISC-V在应用规模、行业渗透率、生态多样性上,都还有很长的路要走。

在平头哥生态副总裁杨静看来,应用软件,对于整个RISC-V生态的发展至为关键。

这也是平头哥打造无剑600平台的用意所在,通过打牢软硬件全栈地桩和联通更多的第三方IP,让企业能基于RISC-V开发出满足其特定应用需求的高性能稳定可靠的SoC芯片产品。

平头哥已实现RISC-V与Anolis、AliOSThings、FreeRTOS、RT-Thread、Linux、安卓等操作系统的适配,并在商业量产芯片中得到了应用。今年4月,平头哥玄铁C910处理器成功运行TensorFlow Lite,首次实现了RISC-V在安卓12新系统上的AI支持。

孟建熠认为,尽管RISC-V的应用市场会呈现碎片化特征,但是RISC-V生态仍然是标准化和统一的。今天,RISC-V国际基金会正在制定统一标准,来推动生态形成合力。

平头哥也在积极参与其中,已在RISC-V国际基金会中参与了29个技术方向的标准制定,主导负责了10个技术小组,过去一年向基金会贡献8篇技术文章。

再往前走,关键问题是如何将RISC-V架构的可扩展性很好发挥出来,这要求有一个标准化的高性能RISC-V芯片平台,能够承载更加厚重的软件栈,而平头哥正致力于此。

结语:RISC-V仍在生态繁荣的前夜

在孟建熠看来,如果将目标定为渗透到桌面级或云端,那么RISC-V依然处于生态繁荣的前夜,要把开发者生态培育起来,路还很长,需要全球软硬件RISC-V开发者的共同努力。

可以看到,平头哥打造无剑600平台的目标,不是售卖自己的芯片,也不是授权几乎单一的标准化处理器IP,而是纵向上面向通用计算和特定领域做软硬件全栈的适配和优化,横向上扩展对第三方IP的支持,由此降低RISC-V芯片的开发门槛,来吸引更多的生态合作伙伴。

这样的策略,将在帮助RISC-V架构进入高性能应用的同时,助力芯片产品及应用走出多样性,共同推动RISC-V生态繁荣。