TOPS算力超华为昇腾910近2倍!美国AI芯片创企Groq官宣TSP架构

芯潮(ID:aichip001)编 | 韦世玮

芯潮11月15日消息,美国当地时间11月14日,AI芯片创企Groq宣布,其研发了世界上第一个能在单个芯片上每秒执行1000万亿次操作(1000 TOPS)的芯片架构,专门针对计算机视觉、机器学习和其他AI相关工作负载的性能需求而设计。

这是该公司自今年10月展示其最新研发的张量流处理器TSP(Tensor Streaming Processor)架构以来,再次释放出有关AI芯片研发的重磅信息。

据悉,Groq将于美国时间11月17日至21日,在丹佛举行的超级计算大会上向合作伙伴和客户展示这款新架构。

目前,TSP正在进行客户测试。

一、每秒1000万亿次计算、250万亿次浮点运算

Groq表示,这款新型TSP在单芯片上能实现高达1000 TOPS的性能,将近是华为昇腾910的2倍,而昇腾910为512 TOPS。

另一方面,TSP的浮点运算能力为250 TFLOPS,虽不及谷歌TPU v3和华为昇腾910,但却刚好是英伟达Tesla V100 GPU的两倍。

TOPS算力超华为昇腾910近2倍!美国AI芯片创企Groq官宣TSP架构

实际上,Groq的TSP架构受软件优先的启发,能够实现实现计算灵活性和大规模并行性,且不需要传统GPU和CPU架构的同步开销。这无疑为业界提供了一个创新范例。

此外,TSP能同时支持传统的机器学习模型和新的机器学习模型。目前也正在x86和非x86系统的客户站点上运行。

同时,由于TSP专为计算机视觉和AI等相关领域应用而设计,并释放了更多以往专用于动态指令执行的硅空间。

另外,该架构还提供了严格控制的能力,可进一步满足那些对安全性和准确性有着高要求的应用程序。

与基于CPU、GPU和FPGA的复杂传统架构相比,TSP还简化了架构的认证部署,使客户能够简单而快速地实现可扩展的、高每瓦性能的系统。

TOPS算力超华为昇腾910近2倍!美国AI芯片创企Groq官宣TSP架构

二、第一周启动硅芯片,A0硅芯片开始生产

“我们为这个行业和我们的客户感到兴奋。”Groq的联合创始人兼CEO Jonathan Ross表示,那些顶尖的GPU公司一直在告诉客户,他们希望能够在未来几年内交付一种拥有PetaOp/s性能的产品,而Groq率先宣布了它,同时还以此设定了新的性能标准。

在Jonathan Ross看来,就低延迟和每秒推理性能而言,TSP比任何其他架构的推理速度都快许多倍。

“我们与客户的互动测试证实了这一点。”他说,公司在第一周启动了第一个硅芯片,紧接着在第一天就启动了程序,随后在不到六周的时间里向合作伙伴和客户取样,A0硅芯片开始生产。

与此同时,Groq首席架构师Dennis Abts表示,Groq的解决方案对大多数应用程序的深度学习推理而言,是非常理想的。

他还补充到,除了这个巨大的机会之外,Groq的解决方案还针对广泛的工作负载。“TSP的性能,加上它的简单性,将使它成为任何高性能、数据或计算密集型工作负载的理想平台。”Dennis Abts说。

三、挖走谷歌8名核心人员,已筹集6700万美元融资

实际上,成立于2017年的Groq,总部位于美国加州山景城,其创始团队中有8名都出身于谷歌的TPU核心团队。

2017年11月,Groq宣布其将在2018年发布其第一代AI芯片,并表示这款芯片的运算速度将达到400 TOPS,每瓦特进行8万亿次运算,算力比谷歌最新一代TPU还高出两倍。

然而,宣布这一远大目标后的Groq却始终低调行事,再未对外界释放出任何消息。直到今年9月,它才开始陆续放出其募集6000万元资金,以及张量流创新架构白皮书的新动态。

如此受业界密切关注的Groq,芯潮在近日也曾对这家公司的团队与核心技术进行过拆解。(《撬走谷歌TPU核心团队的4/5,任性缺席美国AI硬件峰会,这家AI芯片创企在酝酿什么大招?》

Groq表示,其将针对计算密集型应用程序的高效软件驱动解决方案,为业界提供具有领先的性能、准确性和亚毫秒级延迟的产品。

此外,Groq还希望能通过对关键技术的创新研发,以重新定义计算。

截至目前,Groq已筹集了6700万美元的融资资金。

结语:为AI芯片架构创新提供新思路

不难看出,自创立之初就一直受到行业密切关注的Groq从不走寻常路,特别是在技术研发方面亦有着极其大的愿景和野心。

虽然,Groq的创新架构从推出到落地,其是否能真正地实现商业价值,还需要时间和市场来为我们验证。

但不可否认的是,在业界不断地想要通过优化创新制程工艺和缩小晶体管密度,以持续提高芯片的算力和深度学习推理能力的大趋势下,Groq对AI芯片架构创新研发的挑战,也为业界提供了新的思路和发展方向。

文章来源:Groq