AI训练和推理芯片落地超算!这家创企明年推新训练芯片,性能提升超2倍

西(公众号:aichip001
作者 |  高歌
编辑 |  

芯东西4月13日报道,今日,被英特尔收购的知名以色列AI芯片公司Habana Labs在北京分享了其云端芯片在超算领域的最新落地进展:其AI训练芯片及推理芯片将被搭载于美国加州大学圣地亚哥分校圣地亚哥超级计算机中心(SDSC)的Voyager超级计算机,计划在2021年秋季投入使用。

期间,Habana Labs中国区总经理于明扬与芯东西等媒体进行深入交流。除了披露更多此次落地进展的细节外,于明扬还回应了被英特尔收购后的业务路线变化,并透露下一代云端训练芯片的性能表现。

AI训练和推理芯片落地超算!这家创企明年推新训练芯片,性能提升超2倍

一、美国超算中心采用,打入科研领域

Habana Labs创立于2016年,总部位于以色列特拉维夫,2019年被英特尔以20亿美元收购,成为英特尔数据产品集团独立运营的业务部门。

此前,其自研云端AI推理芯片Goya和云端AI训练芯片Gaudi已被云计算巨头亚马逊AWS应用。

如今,两款芯片迎来新的落地进展,加州大学圣地亚哥分校的圣地亚哥超级计算机中心(SDSC)将在其Voyager超级计算机中采用这两款芯片,这也是Habana Labs在科研领域的一次突破。

Voyager超算由美国国家科学基金(NSF)资助,从事天文学、气候科学、化学、粒子物理学等跨学科和工程领域的AI研究。例如在天文学,AI可以被用于对比外太空图像和判断是否有新的太空物质出现。

而Habana Labs的训练及推理芯片将为这些研究起到加速计算的作用。

Voyager集群采用了336片Gaudi芯片用于AI训练,每个训练节点使用了6个400GbE RoCE的高速互联,推理预测采用了16片Goya芯片,预计今年10月可供研究人员使用。

据于明扬分享,Gaudi和Goya提升了Voyager超算AI工作的性能和效率,使研究人员能够使用可编程张量处理器内核和内核库定制模型。

其中,Gaudi内置集成了10个支持RoCE v2(RDMA over Converged Ethernet)100G以太网端口,可以提升扩展的灵活性,避免扩展能力受于限吞吐量。如果搭配Habana的SynapseAI软件平台,使用者操作起来将更加便捷。

于明扬提到,作为一家初创公司,Habana Labs的产品细节还有待提升,其市场战略基本是选择主流的云厂商进行合作,通过与有代表性的用户进行合作,来打磨、完善产品。

AI训练和推理芯片落地超算!这家创企明年推新训练芯片,性能提升超2倍

二、背靠英特尔生态,仍独立运营

在被问到与英特尔相关的问题时,于明扬回应,Habana Labs仍然作为一家独立公司运营,其市场战略依旧比较独立,也可以及时对用户的问题进行反馈。英特尔为Habana Labs提供了很多客户资源,也使Habana Labs在业内的口碑有所上升。

同时,客户在选择AI芯片时,往往优先选择符合其处理器架构的芯片。在英特尔收购Habana Labs后,双方在生态上有所协同,英特尔的x86处理器也为Habana Labs带来了部分用户。

Habana Labs在被收购后,其技术路线图也没有发生太大的改变,其软件生态也会在模型、工具等方面有很大的进步,还将提供预处理等新功能。

于明扬还特别讲到,因为英特尔的代工业务刚刚起步,所以近两年Habana Labs暂时不会选择英特尔代工,双方会逐步开展更多的合作。

三、预告下一代训练芯片,性能提升超2倍

此前,在AI芯片的训练端,英伟达旗下的GPU(图形处理器)可谓一家独大。而Habana Labs的Gaudi则对这一现状发起了挑战。

于明扬称,Habana Labs的Gaudi芯片与英伟达的旗舰GPU A100相比,虽然性能上还略有不如,但是在性价比上已经实现了超越。他提到,Habana Gaudi基本上已经能够达到A100 70%的性能,而价格则只有A100的一半,这使得很多客户在实际体验后选择了Habana Gaudi。

Habana Labs预计将于明年上半年推出下一代AI芯片,代号为Gaudi 2,将采用台积电7nm制程工艺。与现有的Gaudi芯片相比,Gaudi 2将会有两倍以上的性能提升。

最后,于明扬谈到了未来AI芯片的发展趋势。他认为,异构计算将会是未来芯片的发展方向,GPU、FPGA、ASIC等各类芯片将会根据特点不同,在计算集群中担任不同的任务。而未来的挑战就是如何将不同的任务,部署到最合适的架构上。

结语:背靠英特尔,提升市场竞争力

在加入英特尔的整个生态体系后,Habana Labs的客户资源得到了提升,在产品性价比不错的前提下,为当今的AI芯片市场提供了一种新的选择。而英特尔也借此丰富了自己的武器库,加强了自己在AI芯片领域的实力。在于明扬看来,SDSC作为美国少数超算中心之一,选择Habana Gaudi、Goya,某种程度上说明SDSC看好ASIC芯片在超算集群中的应用前景,也证明Habana Labs的产品在科研领域有一定的发展潜力。

随着Habana Labs产品细节的完善,其AI芯片的市场竞争力也在不断提升,可能会对英伟达在AI训练等领域的地位发起挑战。