睿思芯科推出高性能RISC-V向量处理器,落地DSP,已进入量产阶段

芯东西(公众号:aichip001)
作者 |  ZeR0
编辑 |  漠影

芯东西6月20日报道,今日,RISC-V创企睿思芯科推出其高性能RISC-V向量处理器,首个落地场景为DSP。

该新品为新一代RISC-V V系列DSP IP,面向高端音视频、AI市场需求,可用于处理复杂数字信号,解决AR/VR、AI等领域的复合音频任务挑战。当前这款DSP IP已落地,在国际知名头部客户产品中完成芯片集成与验证,进入量产阶段,并已进入第二代产品开发阶段。

睿思芯科推出高性能RISC-V向量处理器,落地DSP,已进入量产阶段

睿思芯科CEO谭章熹博士来自于美国加州大学伯克利分校RISC-V原创项目组,师从RISC创始人大卫·帕特森(David Patterson)教授。此前,谭章熹曾创立激光雷达芯片公司OURS,该公司在2021年初被美国自动驾驶企业Aurora以1亿美元价格收购。

2021年,睿思芯科完成A+轮融资,由字节跳动及高瓴创投领投,联想创投、双湖资本、水木投资集团、真格基金等跟投,北极光创投、百度风投等老股东持续加码。目前该公司总部位于深圳,在全球有深圳、成都、美国硅谷等多个办公室。

他透露说,今年睿思芯科会持续发力高端处理器领域,近期会有面向更广泛市场的多款基于RISC-V的高性能多核处理器面市。

一、首个面向专业音频市场的高性能向量处理器

​​DSP(Digital Signal Processing,数字信号处理)处理器,主要用于快速实现各种数字信号处理算法,具有高速、灵活、可编程、低功耗等特性。

从1970年的超级电脑,到德州仪器、摩托罗拉发布的早期DSP芯片,再到如今手机等终端设备集成的DSP芯片,DSP处理器经历了一个集成度增加、算力增长、功耗降低的发展历程。

睿思芯科V系列DSP IP不仅可通过强劲算力,保证高品质音频任务,如高保真音频、高质量耳机降噪;还结合强大的向量运算能力和可靠的标量处理能力,应对新型应用需求,包括语音识别、蓝牙基带、360环绕音效等多重任务场景。

睿思芯科CEO谭章熹博士认为:“RISC-V架构有极大潜力开发各种串行和并行的高性能处理器,本次发布的高性能向量处理器正是很好的例子。”

在他看来,该处理器既证实了这一技术突破应用在DSP领域时的优秀表现,也展现了睿思芯科将先进芯片技术落地的能力。此前,其DSP IP产品已在国际知名头部客户产品中完成芯片集成与验证,并进入量产阶段,此次新发布预示着该技术已经准备好进入市场。

具有高算力特点的向量处理器发源于超级计算机Cray,如今包括RISC-V、Arm在内的多种架构都重点增加向量的支持,以应付更高性能应用的需求。

睿思芯科的RISC-V V系列DSP IP,便是向量处理器应用于高性能音频领域DSP的一个例子,它“降维打击”了基于VLIW架构的传统产品,能在更低功耗下带来更强算力、更好地处理复杂任务。

睿思芯科推出高性能RISC-V向量处理器,落地DSP,已进入量产阶段

“VLIW架构并行上限低、算力有限、对编译器支持要求很高。”谭章熹介绍说,“RISC-V作为新兴指令集,没有太多的历史负担,我们使用向量扩展指令,用单一RISC-V指令集开发的DSP IP在垂直领域算力、可扩展性、软件易用性上有了重大突破。”

据悉,在不增加功耗的前提下,RISC-V V系列DSP IP的算力可超过行业竞品数倍。在一个头部客户的音频案例中,睿思芯科仅用几条自定义指令集,以极低的硬件开销,将LC3音频算法的处理效率提升至原方案的11倍,通过性能压制进行了方案替代。

睿思芯科推出高性能RISC-V向量处理器,落地DSP,已进入量产阶段

相比于市面上的旗舰芯片,如今睿思芯科推出的RiVAI系列DSP产品,在EQ算法(4.7倍)、降噪算法(3.6倍)、电池续航能力(2.1倍)上都有较大提升,同时其单位面积功耗仅达到行业旗舰的59%。

睿思芯科推出高性能RISC-V向量处理器,落地DSP,已进入量产阶段

这些性能提升,主要源于三大方面:灵活的运算单元、超高的运算精度、先进的超标量向量流水线架构。

(1)运算单元灵活:该处理器可满足多种运算需求,计算宽度达512bit,支持16/32/64混合精度运算,同时通过并行访存运算,最大限度提升计算密度。

(2)运算精度高:睿思芯科V系列DSP仅通过睿思芯科专利的整数/定点新架构,就能实现其他产品需启用浮点运算才能达到的计算精度,在不损失精度的前提下提供高保真音频的支持。

人耳非常灵敏,能分辨0.5dB的声音信号,对某些算法,V核的精度比业界旗舰产品高3~4dB。人耳的动态范围高达120dB~130dB,在一些特殊场景,V核的精度比业界旗舰产品高160dB,已远超人耳的动态范围。

而使用睿思V系列DSP能够保留更多声音细节,提供更好的音质和听觉享受。假如睿思V系列启用浮点运算,其运算精度更远超行业竞品。

(3)先进的超标量向量流水线架构:睿思芯科V系列可配搭的睿思芯科R系列RISC-V CPU IP,通过超标量架构,保证高实时性、高可靠性。通过7级流水线、多发射、乱序等技术,产品同时拥有优秀的标量运算能力,支持传统的无法向量化的应用。

在这一背景下,通过专门的低功耗设计,睿思芯科V系列DSP处理器具备业界顶尖的能效比。如前文所述,其并行处理能力超越了行业头部企业的高性能系列产品,功耗亦媲美该企业的低功耗系列产品。

二、向量运算结合标量处理,满足AR/VR、AI复合任务需求

随着5G、边缘计算等技术日益成熟,以及AI、虚拟现实、自动驾驶等领域迅速发展,它们都对空间音效(Spatial Audio)、复杂场景实时降噪、高码流实时编解码等复杂音频任务产生需求。

在近两年的千亿市场元宇宙风口上,这些高端音频能力也极为重要。台积电主席刘德音曾谈道,在元宇宙发展浪潮中,AR设备很可能取代手机、VR设备很可能能取代电脑,成为半导体行业未来数十年最大的目标市场之一。

这一趋势下,作为传递信息的介质,音视频表现出色,是打造沉浸感、真实感的重要基础。

此前的消费者反馈也印证了这一趋势。高通发布基于全球6000名消费者调研数据的《音频产品使用现状调研报告》显示,消费者对高品质音频需求呈上升趋势:更高清的无损音质、针对游戏的低时延体验、更好的语音通话质量、主动降噪以及无干扰音质。

这意味着,同一产品里的DSP,可能既需完成音频解码的任务,保证高采样率、提供高品质音频;又需满足其他音频新需求,如降噪能力、360度环绕音效;AI相关的语音、语义识别等额外功能同样成为消费产品的必备功能之一。

随着这些功能集于一体,产品芯片不仅需要额外算力,还需要多重复杂任务处理能力。

而睿思芯科此次发布的V系列DSP IP,搭配R系列CPU,即旨在应对此类复合型多任务应用场景。

此外,绵延数年的疫情带动远程办公、学习需求及对娱乐设备的需求持续增长,该趋势在疫情后仍旧继续,也让AR/VR市场渗透不断加速。根据Grand Vew Research数据,2021年全球VR市场规模为218.3亿美元,预计从2022年到2030年将以15.0%的复合年增长率持续扩大。

从芯片市场来看,Research and Markets数据显示,在2021-2026年间,DSP市场预计将以 7.36%的复合年增长率增长,到2026年将达到 194.29亿美元,驱动力包括消费电子产品行业、其他智能设备(如智能电视、智能手表和智能平板电脑)数量的增加、汽车市场等。

此前,同领域的竞品或能效比不高,或性能不足,都无法完全满足不断增长的高品质音频领域芯片需求。而随着AR/VR、自动驾驶、AI等领域发展,主攻高端音视频领域芯片赛道的睿思芯科V系列DSP IP拥有巨大潜力。

三、RISC-V走向落地,高性能处理器版图逐步铺开

当前,睿思芯科V系列DSP IP已经落地,在国际知名头部客户产品中完成芯片集成与验证,进入量产阶段,并已进入第二代产品开发阶段。

这背后,与团队的深度定制能力、睿思芯科在开发生态搭建的长期积累密不可分。

一直以来,高性能处理器真正落地应用时对开发人员的挑战往往较高,而睿思芯科提供了完备的生态系统——自主研发的GCC/LLVM编译器、丰富全面的SDK(DSP算法库、数学库、NN库等)以及成熟的IDE开发环境和调试手段——保证软件开发人员使用时能够得心应手,也能做到快速移植。

在产品研发过程中,睿思芯科秉承Silicon Proven的理念,其IP产品线的各个产品均在包括台积电、联电、格芯、中芯国际等多个晶圆代工厂的深亚微米先进工艺进行投片,完成RISC-V处理器IP的硅验证。

从技术储备到开发生态搭建再到硅验证,睿思芯科不仅让客户芯片达到极致优化的PPA性能,还多方面保证了合作芯片的量产落地。

结语:睿思芯科高性能处理器版图落地的一小步

谭章熹说,本次RISC-V CPU/DSP IP产品发布只是睿思芯科高性能处理器产品版图产业化落地的一小步。此前,V系列IP就已经完成了与行业头部客户的投产验证,本次发布标志着这一突破性技术的进一步普及,进行正式发行(GA,general availability)。

据他透露,睿思芯科其它先进技术产品还在和选定的高端客户进行合作落地,在完成技术验证后也会逐步向行业更多客户开放。

未来,睿思芯科计划通过RISC-V架构带来更多革新性的高性能处理器,满足未来从边缘到数据中心中央等各领域的高算力要求。