解密英特尔Meteor Lake新架构:Intel 4工艺首秀,能效和AI亮大招

芯东西(公众号:aichip001)
作者 |  云鹏
编辑 |  李水青

芯东西9月20日消息,近日英特尔与智东西在内的少数业内媒体进行了深入交流,针对最新Meteor Lake处理器在工艺、架构、封装、AI等方面的技术新特性进行了深入解构分析。

解密英特尔Meteor Lake新架构:Intel 4工艺首秀,能效和AI亮大招

新一代Meteor Lake处理器采用了Intel 4制程工艺,Intel 4利用了用极紫外光刻技术(EUV),重点在于优化能效;架构层面其首次增加了“低功耗岛能效核”;Foveros封装技术的应用成为了架构改革的基础;同时英特尔在AI方面首次将神经网络处理器(NPU)集成到了客户端芯片中。

一、重点押宝EUV,简化工艺提升良率,能效比成Intel 4关键优势

具体来看,在工艺制程方面,根据英特尔IDM 2.0战略,英特尔计划在四年里实现五个制程节点的迭代,并在2025年走到领先的位置。目前台积电和三星两大芯片代工巨头也在先进制程方面投入较大,英特尔实现这一目标面临着不小的压力。

解密英特尔Meteor Lake新架构:Intel 4工艺首秀,能效和AI亮大招

Intel 4这一代工艺利用EUV技术改善了芯片良率,同时缩小了晶片面积,以实现更高的能效。在交流中英特尔提到,Intel 4这代工艺对他们来说十分重要,对后续几个制程节点的推进十分关键。

解密英特尔Meteor Lake新架构:Intel 4工艺首秀,能效和AI亮大招

与Intel 7相比,Intel 4的面积微缩在2倍左右,逻辑库性能更高,对EUV光刻技术的工艺进行了简化,同时其专门针对高性能计算应用进行了优化,相比上代,iso功率性能提升了20%。基于Intel 4工艺的高密度MIM电容器,其供电性能相比上代也有一定提升。

解密英特尔Meteor Lake新架构:Intel 4工艺首秀,能效和AI亮大招

据称英特尔在EUV光刻技术方面进行了大量投资,目标是简化、改进互连架构设计。

根据公开数据,一台典型EUV光刻机的价格为1.8亿英镑,重量为180吨,需要四架波音747和35辆卡车运输,目前EUV光刻机的独家供应商为荷兰ASML。

EUV光刻技术可以显著简化互连架构的制程工艺,同时支持微缩,可以让Intel 4工艺中的掩码减少20%,工艺步骤减少5%。

值得一提的是,Intel 4兼容EMIB和Foveros等先进封装技术。

二、先进封装成新架构实现基础,让“芯片DIY”更自由

提到先进封装技术,英特尔从Meteor Lake开始,将Foveros技术引入到客户端产品中。

Foveros能做什么?

实际上目前英特尔大部分客户端处理器的单片式晶片中都包含CPU、GPU、PCH等众多功能模块,随着这些功能日益多样化且变得越来越复杂,设计和制造这些单片式系统级芯片的难度越来越大,成本也越来越高。

Foveros封装技术可以利用高密度、高带宽、低功耗互连等特性,把采用多种制程工艺制造的这些模块组合成“大型分离式模块架构”,从而组成晶片复合体。

解密英特尔Meteor Lake新架构:Intel 4工艺首秀,能效和AI亮大招

具体来看,Meteor Lake主要包含三个大的模块,包括图形模块、使用Foveros 36X间距晶片间互连的SoC模块以及采用Intel 4制程工艺制造的计算模块。

在技术指标方面,Foveros封装技术可以实现36u的凸点间距,迹线宽度在1微米以内,凸点密度提高了近8倍,迹线长度在2毫米以内。同时Foveros封装技术可以实现160GB/s/mm的带宽,功耗小于0.3Pj/位。

解密英特尔Meteor Lake新架构:Intel 4工艺首秀,能效和AI亮大招

比较直观的来看,相比12代的Raptor Lake,Foveros封装减少了低功耗晶片互连的分区开销,更小的区块提高了晶圆良率,英特尔甚至可以为每个区块选择更适合的硅工艺,同时,这一封装对于SKU创建的简化也有利于英特尔提升定制服务能力。

解密英特尔Meteor Lake新架构:Intel 4工艺首秀,能效和AI亮大招

据英特尔介绍,他们正在大力投资晶圆级组装的Meteor Lake以及未来的新项目,这些新产线可以为Foveros Direction 9微米等项目提供产能。

三、40年来重大架构转变,能效依然是提升重点

在架构方面,英特尔称基于Intel 4制程工艺的Meteor Lake是英特尔迄今为止能效最高的客户端处理器,并且可以提供多种AI功能。

英特尔甚至将Meteor Lake称为“40年来重大的架构转变,为未来PC创新奠定基础”,可见其对于此次架构升级的重视。

解密英特尔Meteor Lake新架构:Intel 4工艺首秀,能效和AI亮大招

Meteor Lake的“分离式模块架构”由四个模块组成,通过英特尔的Foveros 3D封装技术进行连接。

其中计算模块(Compute Tile)同样是“能效核+性能核”的微架构,在功能方面有所增强,采用了Intel 4制程工艺,在能耗比方面提升比较明显。

SoC模块(SoC Tile)集成了神经网络处理器(NPU),可以提升PC运行AI应用时的能效表现,同时兼容OpenVINO等标准化程序接口,便于AI的开发和应用普及。

解密英特尔Meteor Lake新架构:Intel 4工艺首秀,能效和AI亮大招

比较值得注意的是,英特尔此次在直连到SoC结构的SoC模块上添加了新的低功耗岛能效核,这一变化适合应对新的低功耗工作负载,优化了节能和性能间的平衡。

在英特尔看来,新增的低功耗岛能效核是混合架构的第一个重大进展,该架构的首次引入是在12代Alder Lake上。新的3D混合架构和计算模块上的能效核、性能核进行协同,进一步提升了整个处理器的能效比表现。

Meteor Lake架构中的SoC模块支持Wi-Fi 6E、支持8K HDR和AVI编解码器以及HDMI 2.1和Display Port 2.1标准。

在图形模块(GPU Tile),新架构集成了英特尔独立显卡中的“同款”图形架构,性能相比传统集显有比较明显的提升,性能是上一代的2倍。此外,IO模块(IO Tile)集成了Thunderbolt 4和PCle Gen 5.0。

四、NPU与处理器内部各模块协同,拆解NPU内部两大“秘密武器”

AI是今天每家芯片公司都绕不过去的一个重要方向。

此次英特尔第一次在客户端平台中集成了NPU,同时该模块与处理器内所有计算引擎的内置AI功能结合,从而实现更高能效的AI计算。

解密英特尔Meteor Lake新架构:Intel 4工艺首秀,能效和AI亮大招

比如GPU的高性能并行性和高吞吐量适合在媒体、3D应用程序和渲染管线中引入AI功能,而NPU则是专用低功耗AI引擎,更适合用于维持AI运行和AI卸载,CPU则具有更快的响应能力,适合轻量级、单推理、低延迟的AI任务。

Meteor Lake中的这个NPU采用了多引擎架构,配备了两个神经计算引擎,可以共同处理单一负载也可以各自处理不同的负载。

解密英特尔Meteor Lake新架构:Intel 4工艺首秀,能效和AI亮大招

对神经计算引擎进一步拆分,其两个重要的计算组件包括推理管道和SHAVE DSP。推理管道由一个乘积累加运算(MAC)阵列、一个激活功能块和一个数据转换块组成,通过减少数据移动并利用固定功能运作来处理常见的大计算量任务,实现更高能效。

解密英特尔Meteor Lake新架构:Intel 4工艺首秀,能效和AI亮大招

SHAVE DSP是专门为AI设计的超长指令字/数字信号处理器,其流式混合架构向量引擎(SHAVE)可以与推理管道、直接内存访问(DMA)引擎一起协同,在NPU上进行并行异构计算,提高性能。

英特尔相关高管在英特尔马来西亚科技巡展上提到,AI正在融入我们生活的方方面面,云端AI存在其局限性,AI正逐渐走向边缘,在行业的关键转折时期,英特尔选择将AI引入PC端。

解密英特尔Meteor Lake新架构:Intel 4工艺首秀,能效和AI亮大招

Meteor Lake的AI计算与连接无关,成本更低,同时可以更好地保护隐私。

结语:能效和AI成英特尔新架构突出特点

纵观此次Meteor Lake的一系列工艺、架构、封装、AI能力升级,我们可以鲜明地看到能效比提升以及AI能力的下放是其两大核心特点。

如今能效比几乎是所有先进芯片竞争焦点中的焦点,而消费电子终端产品AI能力的提升,也已经成为行业大势所趋,边缘侧的AI落地,离不开芯片厂商们的推动。

面向未来五年,英特尔能否按照自己的节奏稳步迭代工艺,面向竞争激烈的芯片市场,英特尔还有怎样的大招要放出,我们拭目以待。