Imagination推最强多核GPU系列!AI算力达24 TOPS,支持自动驾驶和数据中心

芯东西(公众号:aichip001
文 | 心缘

芯东西10月13日报道,刚刚,Imagination Technologies宣布推出又一大重磅新品——全新IMG B系列GPU IP

这是其第一个包含新多核架构的GPU IP系列可提供单位面积最高的性能,峰值算力可达6 TFLOPSAI算力可达24 TOPS,其汽车GPU已符合ISO 26262安全标准要求,并支持自动驾驶和辅助驾驶。

与上一代IMG A系列产品相比,B系列功耗降低了30,面积减少了25%,同时填充率比竞品IP内核高2.5倍,针对给定的性能目标还能实现更低的功耗和高达35%的带宽降低

Imagination推最强多核GPU系列!AI算力达24 TOPS,支持自动驾驶和数据中心

因移动GPU声名鹊起的Imagination,正将业务范围拓展到更广泛的疆域。凭借核心部分的可扩展性,IMG B系列不仅适用于传统的移动设备、消费类设备、物联网、微控制器、数字电视(DTV)、汽车等市场,还能拓展至桌面GPU、云端GPU的性能水平

当前IMG B系列已可提供授权,每个产品系列都已有厂商率先获得了授权。Imagination Technologies首席营销官David Harold称,已有几家客户正在接洽其桌面级和云端GPU产品,这些项目将在明年公布。

从披露的性能来看,这俨然是Imagination深耕GPU IP领域25年以来布下的又一枚重棋,在中美贸易摩擦不断的背景下,这家英国公司凭借自身的技术实力和不受美国约束的优势,有望在图形处理领域搅起更精彩的战局。

一、四大产品系列,满足各种特定市场需求

IMG B系列GPU拥有四个产品系列,可以针对特定的市场需求提供专业的内核:

Imagination推最强多核GPU系列!AI算力达24 TOPS,支持自动驾驶和数据中心

1IMG BXE面向高清显示应用,专门针对用户界面(UI)渲染和入门级游戏设计,每个时钟周期可处理1-16个像素,支持720p8K的分辨率,相较上一代内核面积缩减多达25%,同时其填充率密度高达竞品的2.5

2IMG BXM主打图形处理体验,是一种中端解决方案,引入客户可配置的最新缓存设计,实现了填充率和计算能力的最佳平衡,可将带宽占用降低35%,为中档移动端游戏及用于数字电视和其他市场的复杂UI解决方案提供支持。

3IMG BXT面向高性能应用,旗舰版GPU内置四核,可提供6 TFLOPS的性能,每秒可处理192 Gigapixel(十亿像素),AI算力达24 TOPS,同时可提供行业最高的性能密度

4IMG BXS面向汽车应用,符合ISO 26262安全标准,这使其成为迄今为止所开发的最先进的汽车GPU IP内核,提供了从入门级到高级的完整产品系列,能将自动驾驶图形处理速度提升至竞品的60%以上,可为下一代人机界面(HMI)、UI显示、信息娱乐系统、数字驾舱、环绕视图提供解决方案,高算力的配置还可支持自动驾驶和辅助驾驶。

Imagination推最强多核GPU系列!AI算力达24 TOPS,支持自动驾驶和数据中心

和IMG A系列相似,B系列GPU也支持AI协同(AI Synergy)技术,在提供图形处理功能的同时,可用其备用资源来处理可编程AI等任务。

Imagination Technologies技术产品管理资深总监Kristof Beets在接受芯东西专访时提到:“B系列是我们有史以来最广泛的产品系列,我们解决了广泛的功耗、性能和面积设计要点,能满足不同市场和不同客户的需求。”

二、两大创新:多核架构与IMGIC技术

Imagination Technologies首席执行官Simon Beresford-Wylie提到,IMG B系列建立在大量投资及A系列技术优势的基础上,同时增加了多核技术,以33种全新配置扩展了其GPU产品系列,能为各种需求提供最佳的GPU。

此次推出的全新系列能取得如此显著的进展,得益于两大创新:多核架构和Imagination图像压缩(IMGIC)技术。

1、多核架构:高效可扩展

新的多核架构采用Imagination自研高性能、低功耗内核,并整合了一种创新的分散管理方法,可提供高效的扩展特性,并可与小芯片(chiplet)架构等行业趋势相适。

Imagination推最强多核GPU系列!AI算力达24 TOPS,支持自动驾驶和数据中心

BXT和BXM内核的每个产品系列已基于多核架构进行优化,可实现GPU内核的多核扩展,每个核既可以独立运行,也可以组合成一个大GPU来协力执行任务,能为单个应用提供最大化的性能,或根据需要,支持不同内核运行独立的应用。 

另据Kristof Beets介绍,采用B系列多核设计的7nm台式机GPU,频率可达到1.5 GHz,可用于客户想要实现的桌面GPU应用;在数据中心,GPU可被灵活的组合或拆分,还能在多实例环境中提供支持,结合其虚拟化功能,能有效支持云游戏、远程桌面等云端应用。例如,芯动科技已将BXT内核集成到其桌面GPU和数据中心GPU芯片上。

Imagination推最强多核GPU系列!AI算力达24 TOPS,支持自动驾驶和数据中心

BXE内核提供了主核-次核的扩展模式,这是一种面积优化的解决方案,通过单个GPU内核提供了高性能,同时可以利用其HyperLane(超线程)技术,进行多任务并行处理。

BXS汽车GPU内核也以多核及多个主要管线设计为特色,为汽车应用提供了从小型安全备份内核到高性能计算内核的多种选择,不仅支持性能扩展,还提供了更高的安全优势,可用于检查多个GPU核之间的正确运行。

2IMGIC技术:多种压缩方案节省带宽

消费级市场对带宽开销非常敏感,因此IMG B系列还搭载了其帧缓冲压缩技术的最新版本——IMGIC技术,这被称为是当前市场上最先进的图像压缩技术,可为SoC设计人员提供多种节省带宽的灵活选择,并有助于进一步优化性能或降低系统成本。

IMGIC包含1种完全无损压缩模式和3种有损压缩模式,3种有损压缩模式的压缩率分别为75%(质量接近完美)、50%(视觉无损)、25%(最节省带宽)

Imagination推最强多核GPU系列!AI算力达24 TOPS,支持自动驾驶和数据中心

IMGIC技术可以兼容B系列中的所有内核,即便是最小的工业级IoT内核,也能够具备其图像压缩技术。

如今高端智能手机动辄采用4K显示屏、高达120Hz的刷新率,读写耗费的速度接近8GB/s。而如果使用IMGIC的无损模式,可在不影响质量的前提下,将其显著降低到平均仅4GB/s;如果使用有损压缩,压缩率为75%、50%、25%时,带宽可分别降至6GB/s、4GB/s、2GB/s。

除此之外,在汽车、数字电视(DTV)、机顶盒(STB)及服务器市场,IMGIC均能通过平衡质量与带宽,提供更好的整体系统体验。

三、Level 4光线追踪技术明年见

实时光线追踪可模拟光的物理行为,精确追踪场景中光线的路径,将3D场景渲染地更为逼真、更贴近真实世界。Kristof Beets称其为“过去103D图形处理领域最令人兴奋的进展”。

光线追踪率先被引入到PC领域,而移动设备被看作是这一技术的下一个着力点。Imagination用近十年时间投入光线追踪技术研究,已形成成熟的移动光线追踪架构,并提供相应IP授权。除了NVIDIA外,当前仅有Imagination实现了硬件光线追踪技术。

尽管越来越多硬件开始支持光线追踪,但这些硬件并非全都一样,为了帮助业界了解各种解决方案之间的差异,近期,Imagination开发了一套从0级到5级的光线追踪等级系统,来帮助业界了解各种解决方案之间的差异。

这是继去年年底公布支持光线追踪功能的GPU IP路线图后,Imagination在光线追踪领域公布的又一重要进展,该系统旨在帮助开发人员和原始设备制造商(OEM)清晰了解现在和未来可用的光线追踪加速解决方案的功能。

Imagination推最强多核GPU系列!AI算力达24 TOPS,支持自动驾驶和数据中心

该系统能对光线追踪加速的先进功能进行等级鉴别,有了这一系统,游戏引擎、智能手机厂商等就可以更清晰地了解和比较各种光线追踪实现方式之间的差异,从而最终使消费者能在移动设备上享受到电影级逼真画面。

光线追踪等级系统共包括6个等级,随着等级提升,光线追踪功能会有更高的性能和硬件利用率:

Level 0:传统解决方案;
Level 1:传统GPU上的软件;
Level 2:硬件中的光线/方框和光线/三角形测试器;
Level 3:硬件中的边界体积层次结构(Bounding Volume Hierarchy,BVH)处理功能;
Level 4:硬件中的BVH处理和一致性排序功能;
Level 5:硬件中带有场景层次生成器(Scene Hierarchy Generation,SHG)的一致性BVH处理功能。

Imagination推最强多核GPU系列!AI算力达24 TOPS,支持自动驾驶和数据中心

在发布B系列的现场,Kristof Beets也提及光线追踪的4级性能路线图,到Level 4才能实现最好的用户体验、更高算力、更低带宽,可实现桌面级高效性能的提升。

他透露道,Level 4光线追踪技术将在明年上半年正式推出。

四、深耕AI七年有余,不受中美摩擦影响

图形处理领域迎来了新一轮技术创新的风潮。低功耗的栅格化图形处理、开创性的光线追踪、持续创新的AI技术……各种新兴技术正将图形处理效果提升至新的高度。

从综合实力来看,Imagination在移动GPU市场俨然极具竞争力的重量级玩家,透过近年其一系列新的技术进展及产品布局,我们可以看到它的技术实力和雄心从未止步于移动和汽车市场,而是逐渐扩展向更丰富的高性能图形处理及AI应用。

那么Imagination的综合竞争力来源于哪里?我们从产品交付经验、AI成果、受贸易摩擦的影响三方面进行解读。

1、超过25年积累的丰富产品线和交付经验

Imagination主要有三大产品线PowerVR GPUPowerVR视觉和AI,以及Ensigma无线连接和广播通信

在其超过25年的历史中,Imagination先后推出过多代GPU产品,已积累超过1500GPU专利,在移动GPU领域的市场份额接近36%,在汽车领域更是达到43%

Imagination推最强多核GPU系列!AI算力达24 TOPS,支持自动驾驶和数据中心

去年12月,Imagination在上海首发其号称是“万物GPU”的旗舰产品IMG A系列,如今随着新一代B系列的登场,Imagination正为覆盖越来越多应用的图形处理革命注入新鲜的血液。

除此之外,其专用AI计算硬件IP产品NNA系列、Wi-Fi和蓝牙IP等无线连接系列均在业界性能领先。借助这些IP,打造高性能、低功耗芯片的研发门槛能够进一步降低。

截至目前,带有Imagination IP的芯片产品累计出货量已超过110亿

2AI专利超过80项,算力可达几百TOPS

Imagination在过去7年持续加大对AI研发的投入,迄今已拥有超过80项针对AI领域的专利

截至目前,Imagination已推出一系列神经网络加速器(NNA)产品,其中2NX NNA在2019年的AI Benchmark性能测评中高居第一,3NX NNA进一步提升性能,可提供从1 TOPS到几百TOPS的算力,能满足从L2级到L5级自动驾驶的边缘推理需求下个月,Imagination还将发布第四代NNA产品,同样基于多核架构。

GPU是AI浪潮的重要推动力,Imagination也优化了GPU上支持AI运算的能力,还开发了一项创新的AI协同技术,可将GPUNNA结合形成异构AI计算平台,借助GPU硬件虚拟化功能,GPU去处理图形和可编程AINNA去处理固定功能的AI运算,从而实现更高的性能和效率。

Imagination推最强多核GPU系列!AI算力达24 TOPS,支持自动驾驶和数据中心

例如在汽车应用案例中,GPU可为仪表盘、车载信息娱乐系统/导航系统、全景环视系统等应用提供高性能和稳定的支持,同时GPU+NNA技术组合还能满足目标检测、驾驶员监测、碰撞监测、自动驾驶等应用的计算需求。

在软件支持方面,开发者可借助同一套开发工具、同一个IMG DNN API来同时对NNA和GPU进行优化,使开发过程更加轻松、方便。

3、与中国客户的合作不受政治环境的影响

Imagination的总部在英国,同时已在中国的上海和北京建立了研发机构。David Harold强调:“Imagination没有在美国开发过任何一款IP。”

Kristof Beets也在接受采访时提到:“Imagination是一家全球IP供应商,我们的许多技术都是在英国设计的,不受美国贸易规则的约束。

据他介绍,Imagination已与中国市场的内容开发人员长期合作,包括提供培训课程、访问其用于创建优化内容的工具和指南文件,以及向中国合作伙伴提供计算、图形和游戏等能力。

David Harold还谈到,他们有很大意愿在中国进一步发展销售、技术和工程团队,尽管受限于当前的市场环境和国际形势,这些计划暂时无法落地,但他们将继续坚持这些想法。

结语:与中国市场互利共赢

在过去的几年里,Imagination经历了起伏,因为它似乎失去了一个大客户的青睐而陷入了低谷。然而,随着主要客户的回归以及新业务的不断拓展,公司在2020年的市场份额和收入正在迅速增加。如今Imagination显然已踏上新的征程,不仅有条不紊地推出最强性能的GPU IP系列,并在AI、光线追踪等新兴技术领域持续发力。

对于Imagination而言,中国市场日益成为不可或缺的重要营收来源,也为其进一步扩展GPU市场份额提供了更多的机会。同时,面对纷繁的中美贸易摩擦,像Imagination这样拥有中资背景、不受美国技术限制的半导体IP公司,也有望为国内芯片市场带来更多良性发展的可能。