谷歌加入AI超算芯片竞赛!首款自研Arm CPU亮相,“宣战”微软、亚马逊

芯东西(公众号:aichip001)
编译 | 王傲翔
编辑 | 程茜

芯东西4月11日消息,谷歌在周二年度云计算大会Cloud Next 2024上正式推出基于Arm架构的首款自研CPU Axion,并宣布最新一代云端AI加速芯片TPU v5p正式上市。

谷歌云首席执行官托马斯·库里安(Thomas Kurian)在大会上宣称Axion比当今云中最快的、基于Arm架构的通用芯片的性能高出30%,也比当前一代x86架构芯片的性能高出50%,能效高出60%。

Axion专门用于数据中心的数据处理和运算。谷歌在官网介绍称,在应对信息检索、全球视频分发以及生成式AI等场景时,Axion能提供业界领先的性能和能效。

谷歌加入AI超算芯片竞赛!首款自研Arm CPU亮相,“宣战”微软、亚马逊

▲Thomas Kurian介绍Axion相比当前x86架构芯片的性能提升(图源:Cloud Next 2024)

一、谷歌首款Arm CPU,将用于谷歌云服务

Axion采用Arm Neoverse V2 CPU核心,能够为计算机在内存缓存、数据分析、介质处理等通用工作提供较高的性能支持,并提升基于CPU的AI训练和推理能力。

此外,Axion以Titanium架构为基础。由于Titanium卸载了网络和安全等平台操作,因此Axion能够获得更大设备内存,承担更大的工作负载。对于不同的工作,Axion也能实时动态调配设备内存,提升工作效率。

利用在Arm生态系统中的贡献,谷歌与Arm和行业合作伙伴密切合作,针对Arm架构对其进行优化。在此基础上,Axion基于Armv9架构和指令集构建,确保常见操作系统和软件包可以在基于Arm的服务器和虚拟机上无缝运行,使客户能够更轻松地在谷歌云上部署Arm工作负载。

谷歌云副总裁兼计算和机器学习基础设施总经理马克·洛迈尔(Mark Lohmeyer)说:“我们让客户更容易将现有的工作负载转移到基于Arm的平台上。Axion建立在开放基础之上,因此客户可以轻松使用Axion,而无需在基于Arm的平台上重新构建或重写他们的应用程序。”

谷歌计划将Axion用于谷歌旗下的多种服务,例如YouTube广告投放、大数据分析等。谷歌称将扩大Axion的使用范围,并在今年晚些时候向客户开放。

二、从TPU到CPU,谷歌加快自研步伐

谷歌自研CPU Axion的推出,意味着谷歌正紧跟亚马逊和微软这些云领域竞争对手的领先地位。

2021年,亚马逊和微软推出了基于Arm架构的CPU,以提供差异化的计算服务。谷歌此前为YouTube视频网站、AI和智能手机等不同场景推出了定制芯片,但并没有研发过CPU。

事实上,谷歌在2016年5月开发者大会上推出自研AI芯片TPU(张量处理单元),并在去年12月7日发布了最新云端AI加速芯片TPU v5p。TPU v5p配备95GB的HBM3内存,每个Pod最多有8960个加速核心,这些加速核心相互连接以支持最大规模的大模型训练。

与上一代TPU相比,TPU v5p每个Pod计算能力提升了4倍,为AI大模型的训练提供了更强的性能。谷歌的TPU也是少数能够替代英伟达先进AI芯片的处理器,但开发者只能通过谷歌的云平台访问TPU,不能直接购买。

谷歌加入AI超算芯片竞赛!首款自研Arm CPU亮相,“宣战”微软、亚马逊

▲谷歌芯片业务副总裁阿明·瓦达特(Amin Vahdat)介绍TPU v5p全面上市(图源:Cloud Next 2024)

结语:谷歌自研“芯片家族”扩大,占据AI芯片竞赛有利地位

继微软、亚马逊之后,谷歌成为了第三家推出基于Arm架构CPU的科技巨头。从TPU到CPU,谷歌自研芯片的能力正不断提升,这些芯片为生成式AI发展提供强劲性能。

虽然Axion具体上市时间还未公布,但凭借这款高能效高性能的CPU,以及Axion对基于Arm架构应用程序的轻松迁移,谷歌或将在“造芯”竞赛中占据有利位置。

来源:谷歌云