英特尔推7nm云端AI训练芯片,吞吐量较A100翻倍

芯东西(公众号:aichip001)
作者 |  ZeR0
编辑 |  漠影

芯东西5月11日报道,在昨晚开幕的英特尔On产业创新峰会上,英特尔CEO帕特·基辛格与多位英特尔高管发表了主题演讲。

现场,英特尔发布了7nm云端AI训练及推理芯片,以及为工程师、科研人员等专业人士打造的第12代英特尔酷睿HX处理器;并宣布第四代英特尔至强可扩展处理器(代号为Sapphire Rapids)出货。

英特尔还公布其代号为Arctic Sound-M的数据中心GPU将于2022年第三季度发布,这是英特尔在该领域首款配备AV1硬件编码器的独立GPU,将拥有两种不同的产品外形设计,可提供150TOPS算力。

此外,英特尔展示了英特尔基础设施处理器(IPU)的路线图,并首次进行了其软件基础设施计划Endgame项目的概念演示。

一、第12代酷睿HX:全新内核架构、更多核心、更大内存

今日英特尔推出的第一个新品,是全新第12代英特尔酷睿HX处理器家族。

英特尔推7nm云端AI训练芯片,吞吐量较A100翻倍

HX处理器家族的7款新品在移动平台封装中均采用了媲美台式机的芯片,能为CAD、动画和视觉特效等专业工作负载提供迅猛性能。

HX处理器覆盖酷睿i5、酷睿i7和酷睿i9不同型号,均带来开箱即用的未锁频性能,最多有16个内核和24个线程。

英特尔推7nm云端AI训练芯片,吞吐量较A100翻倍

该系列处理器具有全新的内核架构、更高一级的功率设定,使内容创建者能处理更苛刻的工作负载,比如在后台执行3D渲染工作的同时,继续在设计场景中遍历其他三维模型素材。

该系列处理器通过更多的核心数、更大内存和I/O支持,把多线程工作负载的性能提升64%,同时借助英特尔硬件线程调度器来充分释放性能核和能效核的性能,让专业人士可以在办公室、家中或旅途中以超高效率进行创作、编程、渲染和工作。

除了用在工作场景,第12代酷睿HX处理器还是游戏平台强者,通过提供更高帧率,满足骨灰级游戏玩家的畅玩需求。

游戏玩家和内容创建者还可以使用高带宽的平台技术,例如支持RAID的PCIe Gen 5、ECC内存,从而带来高级系统数据的完整性和可靠性。

英特尔推7nm云端AI训练芯片,吞吐量较A100翻倍

二、推出7nm云端AI训练芯片,预告数据中心GPU

针对AI加速,英特尔发布专用于高性能深度学习AI训练的英特尔Habana Gaudi2 AI处理器,以及第二代云端AI推理芯片Greco。

英特尔推7nm云端AI训练芯片,吞吐量较A100翻倍

第二代Gaudi训练芯片和Greco推理芯片均采用7nm工艺,较上一代16nm有所提升。Gaudi2可拥有高达96GB HBM2e内存,以及24个集成的100GbE RoCE端口。

据介绍,在训练主流计算机视觉和自然语言处理模型时,Gaudi2的吞吐量可达到英伟达A100的两倍。

英特尔推7nm云端AI训练芯片,吞吐量较A100翻倍

Habana客户现可使用Gaudi2处理器,其第二代Greco推理芯片将从今年下半年开始提供给客户。

英特尔还宣布其代号为Arctic Sound-M(ATS-M)的英特尔数据中心GPU将于2022年第三季度发布

英特尔推7nm云端AI训练芯片,吞吐量较A100翻倍

作为面向多媒体转码、视觉图形处理和云端推理的单一GPU解决方案,ATS-M是英特尔在该领域首款配备AV1硬件编码器的独立GPU

它是一颗支持高质量转码和高性能的强大GPU,能够提供每秒150万亿次运算(150TOPS

英特尔推7nm云端AI训练芯片,吞吐量较A100翻倍

开发人员可以利用oneAPI支持的开放软件堆栈,轻松地开展面向ATS-M的设计工作。

ATS-M将拥有两种不同的产品外形设计,并将获得超过15款来自戴尔、Supermicro、浪潮和新华三等合作伙伴的系统设计。

随后,英特尔首次进行了其软件基础设施计划Endgame项目的概念演示

应用程序可以充分利用这个软件基础设施层,使设备能利用网络中其他设备的计算资源,从而提供始终可用、低时延、连续的计算服务。

例如,在一台设备上运行要求苛刻的GPU工作负载时,可以感知并利用来自更高性能计算设备上的额外图形处理算力,以增强用户体验。

Endgame项目正在开发中,英特尔在今年开始该技术的beta测试。

三、宣布Sapphire Rapids出货,公布IPU产品路线图

面向数据中心,英特尔宣布代号为Sapphire Rapids的第四代英特尔至强可扩展处理器的初始SKU出货。

第四代英特尔至强可扩展处理器将支持DDR5、PCIe 5.0和CXL 1.1,并凭借全新的集成加速器,通过针对AI工作负载的软硬件优化,相较上一代产品可实现高达30倍的性能提升

同时,该处理器具备针对电信网络的新功能,可为虚拟无线接入网(vRAN)部署提供高达2倍的容量增益。内置高带宽内存(HBM)的Sapphire Rapids还将显著提高处理器的可用内存带宽。

英特尔也公布了其到2026年的IPU产品路线图:英特尔首款ASIC IPU Mount Evans和第二代ASIC IPU Oak Springs Canyon FPGA IPU今年发货;400GB第三代IPU(代号为Mount Morgan和Hot Springs Canyon)预计在2023年/2024年交付给客户和合作伙伴;再下一代800GB IPU预计将于2025年/2026年交付。

IPU是具有强化加速功能的专用产品,旨在满足基础设施计算需求,使企业能够高效处理任务和解决问题。

四、首秀Aurora超算安装情况,用AI助力无接触零售

现场,英特尔展示了多个与不同类型客户合作的实际案例。

阿贡国家实验室的计算、环境和生命科学实验室主任Rick Stevens首次展示了极光(Aurora)超级计算机的安装情况,并深入解析它将如何助力解决人类面临的疑难问题,如更准确地预测气候及发现应对癌症的新疗法,同时让百亿亿次计算(E级)广泛应用于研发和创新活动。

极光超级计算机内置了高带宽内存的Sapphire Rapids英特尔至强处理器和代号为Ponte Vecchio的英特尔数据中心显卡,能提供每秒超过两百亿亿次的双精度峰值计算性能,其中英特尔oneAPI亦为开发者提供无缝的系统集成。

英特尔推7nm云端AI训练芯片,吞吐量较A100翻倍

在无接触零售体验场景,美国亚特兰大非接触式商超Nourish + Bloom Market与英特尔以及转型解决方案公司UST合作,正在设计采用计算机视觉技术的下一代自助结账系统,让购物更自主、便捷。

为了在公有云中训练自有神经网络的过程保持工作负载的机密性,博世与英特尔在一个研究项目中合作打造了一个机密AI解决方案。为进一步大规模应用此方案,博世企业研究部开发了一个机密AI平台级框架,该框架使用了第三代英特尔至强可扩展平台上搭载的英特尔软件防护扩展技术。

英特尔也与埃森哲联手启动“阿波罗计划”,旨在通过为企业提供经过优化设计的超过30种开源AI解决方案,让其能在本地、云端亦或是边缘环境中都更易于部署AI。“阿波罗计划”的首批套件预计将在未来几个月内发布

英特尔还与以色列农业机器人公司Blue White Robotics合作开发了一款新型自动化农业解决方案,利用专用无线网络实现农业自动化。

该方案采用了英特尔智能边缘和英特尔至强D处理器,能将种植者的现有设备转变为与互联网管理平台连接的自动化拖拉机车队,帮助农民提高农作物产量及运营效率。

面向人才与教育,英特尔通过AI嘉年华等计划以及与隐藏天才项目(Hidden Genius Project)和Autodesk的合作,来帮助更多有志于AI创新的未来人才。

结语:从底层技术开始改变世界

英特尔CEO基辛格谈道,四大超级技术力量正驱动创新和数字化进程,它们分别是人工智能、无所不在的计算、无处不在的连接、从云到边缘的基础设施,技术对人类而言从未像现在这样重要。

“全球市场正处于最具活力的时代。企业目前面临的挑战错综复杂且相互关联,而成功的关键取决于企业快速采用和最大化利用领先技术和基础设施的能力。”基辛格说。

英特尔正运用其规模、资源、芯片、软件及服务,帮助客户及合作伙伴加速数字化转型。今晚英特尔公布的在芯片、软件和服务方面取得的多项进展及多个实际案例,均展示出其在帮助客户及合作伙伴加速数字化转型的成效。

据介绍,英特尔正采取短期和长期行动,以提高全球产能并改善全球供应链。在短期内,英特尔根据快速变化的客户需求调整生产,例如仅在第一季度,英特尔就根据不断变化的客户需求重制了近300万个CPU。

面向绿色发展,近日,英特尔承诺到2040年实现全球业务的温室气体净零排放,并制订具体目标,以提升英特尔产品和平台的能源效率并降低碳足迹,同时与客户和行业伙伴合作,制订各项解决方案,以降低整个技术生态系统的温室气体足迹。

今晚22点,英特尔首席技术官Greg Lavender还将发表主题演讲,分享英特尔如何帮助解决企业安全需求等话题。