对话英特尔数据平台事业部CTO:IPU如何成云数据中心的战略元件?

芯东西(公众号:aichip001)
作者 |  心缘
编辑 |  漠影

芯东西8月26日报道,继上周英特尔推出一系列IPU新品后,英特尔公司数据平台事业部首席技术官Guido Appenzenller接受芯东西等媒体的采访,并对英特尔IPU的技术及战略进行深入解读。

近年来,随着巨头陆续入场,数据处理芯片DPU逐渐走红,从功能来看,IPU与这些DPU没有本质的差别,只是命名方式不同。

但与业界其他DPU不同的是,英特尔IPU并不做特定数据类型处理或卸载AI负载等任务,而是专注于卸载掉用于基础设施管理和虚拟化的任务。

英特尔IPU因何诞生?它与传统SmartNIC智能网卡有哪些不同?IPU架构的核心优势是什么?专用ASIC版和FPGA版IPU分别适用于怎样的应用场景?在交流过程中,Guido对这些问题一一予以解答。

Guido告诉芯东西,IPU并没有限定适用于某种特定的CPU,也就是说,它可以与任何CPU共事。他还提到在大多数情况下,无论从收益水平还是从财务角度来看,IPU对于云服务提供商都极具吸引力。

一、分担云数据中心基础设施任务,让CPU能全力以赴为云服务租户服务

IPU,全名基础设施处理器(Infrastructure Processing Unit),是一种可编程网络设备,当前主要应用场景是大型云服务提供商。

对话英特尔数据平台事业部CTO:IPU如何成云数据中心的战略元件?

在典型企业数据中心中,CPU总管一切任务。但在云上,要运行的任务不仅有业务程序,还有基础设施的支持程序。

IPU所做的事,就是替代CPU承担运行基础设施软件的任务,从而让服务器CPU更好地聚焦在为云服务租户提供更大性能价值的任务上。

Guido Appenzenller举了个形象的例子,传统数据中心服务器架构好比一个人的家,你可以很轻松地从客厅走到厨房或餐厅。

云数据中心则更像酒店,客房、餐厅和厨房位于不同的区域,会有很多道门或走廊将这些区域分隔开,你甚至得出示胸牌,才能进入不同区域。

对话英特尔数据平台事业部CTO:IPU如何成云数据中心的战略元件?

类似的,云数据中心逐渐发展向将租户工作负责与云服务提供商软件分离,前者在CPU上运行,后者在IPU上运行。

具体而言,IPU主要处理网络虚拟化、存储虚拟化、网络存储管理以及安全等基础设施功能,能对数据中心内的基础设施功能进行安全加速,使系统级资源管理更加智能。

此前,传统智能网卡SmartNIC主要做安全加速网络和存储基础设施,但仍受CPU来控制、管理、编程,更多用在通信服务等场景。

而IPU是SmartNIC的进化,内置CPU核,不仅能实现安全地加速任务,而且可编程,能承担控制管理任务。换句话说,借助IPU,云或通信服务提供商可以管理系统级基础设施资源的控制点,以最大限度地减少资源的滞留或过度使用。

在Guido看来,设计一个出色的IPU有很多挑战,其中最难的部分是获得加速器和流水线。因为它们负责做大部分工作,能够确保具有超高性能、超低延迟,特别是对大规模云提供商影响最大。

他认为,IPU适合任何拥有类似于云的数据中心的客户,除了面向大型云服务商外,预计未来会扩展到规模较小的云服务商和企业数据中心。此外,他也看到了IPU在电信公司的加速场景。

二、英特尔IPU架构的三大核心优势

Guido详细讲解了英特尔IPU架构的三大优势:

对话英特尔数据平台事业部CTO:IPU如何成云数据中心的战略元件?

首先,IPU充当服务器的控制面,负责运行云服务提供商的软件,相当于可以把整个CPU腾出来去服务租户。更好地隔离这些功能将大大加强系统的安全性。

对话英特尔数据平台事业部CTO:IPU如何成云数据中心的战略元件?

其次IPU可对基础设施功能进行优化,进一步提升效率。如下图所示,Facebook研究数据显示,微服务通信开销可消耗31%~83%的CPU性能。

对话英特尔数据平台事业部CTO:IPU如何成云数据中心的战略元件?

可以看到第一列Web应用中,83%的服务器CPU循环被用于开销,包括传输、压缩、解压缩、加密等功能。这些开销均可从CPU转移至IPU。

IPU有一些优化的存储、网络管理加速功能,而CPU不用在处理基础设施任务后,就能聚焦在处理为云服务商产生更大受益的任务上,通过更精细地分工和优化计算来大幅提高性能和能效。

最后,IPU可以管理存储流量,减少时延,并能让云数据中心实现全面的无磁盘服务器架构,进而有效利用存储容量。

由于难以预测每个租户的存储使用情况,在传统企业数据中心架构中,每台服务器通常会配备一套磁盘驱动器和固态盘,以便于应对高峰期的存储负载。

而使用IPU后,客户可以采用全面无磁盘架构,所有存储资源都由中央存储服务来提供。管理一项中央存储服务,显然要比管理数据中心数十万台服务器的存储资源容易得多。

对话英特尔数据平台事业部CTO:IPU如何成云数据中心的战略元件?

当客户在该服务器上启动一个工作负载时,云服务提供商就在存储服务上创造一个虚拟卷。通过管理网络,云服务提供商告诉IPU根据这个虚拟卷创建一个新的NVMe固态盘。

由于这个虚拟NVMe固态盘在PCIe总线来看就像是一个常规固态盘,这一操作将支持大多数操作系统和管理程序,开箱即用。这样一来,客户就可以从这个固态盘启动。

所有网络流量都来自于这些磁盘。IPU非常聪明的地方在于,存储服务器和服务器上的工作负载之间的实际存储流量是在高速路径上进行的,这意味着不会涉及IPU或CPU上的任何CPU内核。

IPU有针对存储流量的固定流水线。在固定流水线中,从存储服务传输到服务器的数据包未被任何处理器处理,因此时延和抖动极低,性能超高。

从CPS的角度来说,就像有一个本地磁盘,但实际上是来自共享存储服务。这能够帮助云服务提供商从直连存储转到完全无磁盘架构。

三、两类IPU产品解读,由客户需求驱动产品

根据不同应用需求,英特尔提供两个系列的IPU,分别是专用ASIC IPU和基于FPGA的IPU。两者预计将在相当长的一段时间共存。

全球大多数云服务提供商已部署英特尔基于FPGA的IPU平台。在美国和中国,六大云服务提供商均使用基于FPGA的IPU,同时Guido观察到他们正逐渐转向专用ASIC IPU。

相比专用芯片,FPGA的灵活性更强,但编程难度相对更高,吞吐量、功耗在一定程度上受限制。

由于当前排名前八的云都用不同的专用存储协议,云厂商如果只使用某一专有协议,选择FPGA很合理;而如果使用其他协议时,专用ASIC会是更好的选择。

在上周,英特尔刚刚发布这两类IPU新品:基于FPGAIPU参考平台Oak Springs Canyon和其首款专用ASIC IPU Mount Evans前者采用英特尔至强D,后者采用Arm Neoverse N1核。两款IPU产品均可使用现有普遍部署的DPDK、SPDK等软件环境进行编程。

对话英特尔数据平台事业部CTO:IPU如何成云数据中心的战略元件?

Oak Springs Canyon是一个基于英特尔至强D处理器和英特尔Agilex FPGA构建的IPU参考平台,这种混合IPU架构能以硬件的速度进行网络管理,同时通过超高的软件灵活性可以使用户更轻松地实施控制面功能。

基于硬件的数据路径(使用FPGA的板载资源)和基于软件的控制平面(与IPU的板载处理器上的基础架构操作系统堆栈一起运行)所提供的可编程性,使得IPU具备更强大的性能表现。

Oak Springs Canyon与基于英特尔至强CPU的服务器协同工作,提供卸载2x100G工作负载所需的基础设施加速;拥有丰富的软件生态系统,并针对英特尔CPU进行了优化,同时还采用了英特尔开放FPGA堆栈,使其合作伙伴和客户能够开发定制的解决方案。该平台能够满足新兴云服务提供商对于部署100GB工作负载的需求。

对话英特尔数据平台事业部CTO:IPU如何成云数据中心的战略元件?

Mount Evans是由英特尔与一家超大型云服务提供商联合设计和开发的ASIC产品,基本上只有作为IPU的功能,适用于超大规模云部署。

它融合了英特尔多代FPGA SmartNIC的经验,有网络子系统(图左)和计算复合体(图右)两个部分。其中网络子系统包含一个固定管线,通过这个管线的数据包是可编程的。

Mount Evans支持200Gb/s的吞吐量,可以把最多4个至强主机连接起来。云对性能的需求将推动存储、消息处理和高性能计算等很多应用迁移到基于RDMA的协议上,而通过实现ROCEv2以及全新可靠传输技术,Mount Evans能够支持上述一系列的迁移。

它还使用扩展自英特尔傲腾技术、硬件加速的NVMe存储接口,NVMe引擎把高性能NVMe设备暴露给主机处理器,让基础设施提供商利用IPU来实施自己选择的存储协议,不管是硬件加速的NVMe-over-fabrics还是计算子系统上的自定义软件后台。

这个可编程数据包处理引擎支持虚拟交换机卸载、防火墙、测量功能等用例,在实际应用中能最高支持每秒2亿个数据包的性能,并提供Inline IPSec以保护网络上发送的每一个数据包。

对话英特尔数据平台事业部CTO:IPU如何成云数据中心的战略元件?

Mount Evans计算复合体采用Arm NeoverseN1 Ares内核,这16个高频率内核附带由三个LPDDR4控制器支持的大型系统级缓存。Guido认为这种选择相当务实,是在评估性能、集成和功率后的最合适组合。

计算复合体与网络子系统密切结合,使得网络子系统加速器能够把系统级缓存用作最后一级缓存,以及提供两者之间高带宽、低时延连接,并能够灵活地整合硬件和软件数据包处理。

Lookaside加密与压缩引擎源自英特尔的Quick Assist技术,英特尔针对IPU使用模式对其进行了修改,其中包括对Zstandard压缩算法的支持。

对话英特尔数据平台事业部CTO:IPU如何成云数据中心的战略元件?

结语:连推IPU新品,英特尔加速布局数据中心

随着云不断扩张,云数据中心正逐渐涌现出更多不同的专用芯片品类,包括GPU、AI芯片以及方兴未艾的IPU等都等。

近年来,除了芯片巨头纷纷入局外,IPU/DPU领域也逐渐成为芯片圈创业的热门方向。有几家创业公司已经拥有许多有趣的技术及产品。Guido相信这对所有厂商来说都是有益的。

在上周英特尔架构日的最后,英特尔CEO基辛格放言:“英特尔回来了,故事才刚刚开始。”作为与CPU、XPU并立的英特尔云战略重要支柱之一,IPU的故事同样还在序章阶段。

长远来看,云端几乎每个服务器都会有类似IPU的东西,市场前景无疑会更广阔。目前,IPU/DPU已被多家芯片巨头公认为极有可能成为未来数据中心设计的又一大战略元件,它扩展了智能网卡功能,推动云数据中心架构走向更高性能、更低成本,云服务提供商显然对此乐见其成。