打破云游戏算力瓶颈!英伟达Ampere联手推出云服务器平台

芯东西(公众号:aichip001)
作者 |  ZeR0
编辑 |  漠影

芯东西8月29日报道,今日,NVIDIA(英伟达)和Ampere Computing宣布推出AICAN服务器平台。用户使用该平台能将位于云数据中心的移动游戏流式直接传输至终端用户,无需下载。

云游戏趋势正促进游戏进一步的大众化,让游戏爱好者能以更方便、更经济的方式来享受高品质的游戏内容,无需为购买高端硬件而花费高额的开销。

NVIDIA GeForce高级副总裁Jeff Fisher谈道,为原生运行移动游戏而生的AICAN平台,能实现最佳的兼容性、性能、成本和用户体验,助推云端流式传输移动游戏市场的发展。

打破云游戏算力瓶颈!英伟达Ampere联手推出云服务器平台▲浪潮AICAN服务器

一、助力跨设备畅玩游戏,让算力不再是云游戏内容升级的瓶颈

什么是云游戏?Ampere Computing中国区产品市场总监孙开本分享说,从游戏玩家角度来看,云游戏的第一个特征是实现玩家设备自由,它将云端经过渲染的数字内容以视频流的方式下发至玩家的手机、平板、PC应用、浏览器等终端设备。

据他观察,无论从玩家参与方式、内容品质、商业模式还是规模来看,云游戏都在快速发展,支撑云游戏的网络和算力基础设施,也同样需要新的方式来适应。

随着玩家对游戏品质要求不断提高,更加身临其境的高品质游戏需要更高的算力,而云服务器在性能上更能满足需求,让算力不再成为内容升级的瓶颈。

借助云化的部署,游戏玩家可以不受限制的访问任何地方的服务器端的资源,只需要有网络接入,就能享受高品质的内容。

同时,云游戏支持跨桌面到移动设备的无缝交叉播放。将游戏应用放到云端后,玩家不必购买新的硬件,也可以大量进行下载、安装、更新等操作,实现“即点即玩,按需畅玩”的最大灵活性、便利性。除此之外,云游戏能够为终端节省大量存储资源和电池消耗。

“对于游戏运营者、内容服务商、游戏开发者而言,云化游戏或者云原生游戏,同样会带来很多本质性的创新和收益。”孙开本说,因为看到这些优势,游戏内容提供商和服务厂商正在推动着云游戏市场的快速增长,以期进一步扩大用户覆盖范围。

值得一提的是元宇宙,从AR、VR、3D体验到实现元宇宙世界,需要大量的技术创新。云游戏正在解决或计划突破的技术挑战,都将加速未来元宇宙方案的落地,某些技术很可能会成为元宇宙将来核心解决方案。“从布局元宇宙长远目标来看,加入云游戏也是内容和服务行业的一个必选方向。”孙开本谈道。

根据中国信通院今年发布的《全球云游戏产业深度观察及趋势研判研究报告》,3年后,中国云游戏的市场规模将达到今年的4倍,用户数量超过今年的2倍。

二、AICAN平台:开箱即用,畅跑安卓云游戏

Ampere Computing和NVIDIA共同打造了一个专用于云游戏的AICAN服务器平台(Android-in-Cloud-with-Ampere-and-NVIDIA)。该平台内置双插槽Ampere Altra Max云原生处理器,最高可达256个内核,可配置多达4个NVIDIA A16或6个NVIDIA T4 GPU,每台服务器最多可支持160个并发用户(CCU)。

这是一个可以开箱即用的“硬件+软件能力”的组合,性能、兼容性和稳定性都经过多方验证,用户无需修改或模拟就能原生运行兼容Arm的移动游戏。

如果云游戏用户有技术问题,NVIDIA及Ampere团队会一起去分析解决,看这个问题从硬件层面还是从软件层面优化更合理。

腾讯先锋云游戏负责人方亮分享说:“现在通过在Ampere Computing和NVIDIA的Arm服务器平台上运行云游戏,我们将多款腾讯精品游戏由3-10G,压缩储存空间到20M左右,用户即便使用存储空间有限的手机也能畅玩精品游戏,这让我们能够接触和覆盖到更广泛的用户,并且提升了增量收入。”

打破云游戏算力瓶颈!英伟达Ampere联手推出云服务器平台▲AICAN 平台架构

云原生的云游戏架构,能够充分利用到云的天然属性。

据孙开本观察,当前很多云游戏服务器不是传统意义上的服务器,它将多个终端的SoC进行集成,形成一种服务器的形态,这种方式的突出优势是游戏部署简单直接,与手机上安装没什么差别。

但因为它不是标准的服务器,所以在很多方面无法满足现代数据中心的标准,也无法在数据中心进行规模化、自动化部署及运维,而是通常会采用一种专署机房的方式,这大大限制云游基础设施的真正云化发展,使得很多云的天然技术属性无法得到发挥。另外,终端SoC性能会限制在上面部署游戏内容的品质,尤其是对以后日益增加的高端游戏。

于是,近年来,游戏内容提供商和服务厂商已经开始采用标准服务器,作为云游戏的算力基础设施。

目前,大多数的云游戏被定义为游戏云化,即游戏开发采用传统方式,只是在部署、分发、服务等方面实现上云。孙开本说,未来,将采用标准的服务器,且游戏的开发、测试、部署、运维、服务等全部都会在云端完成,云游戏将完成从云化到云原生的本质性转变。这种本质性的转变,将带来很多现在SoC方案无法相比的优势,如性能更高、消除设备限制、稳定可靠性得到充分保障。

云服务提供商可以根据算力需求的变化,根据成熟的技术进行灵活的算力调配和扩展,比如白天游戏玩家比较少的时候,可以将很多算力调配到其他的应用上,反之亦可以灵活迅速地进行扩展。

对于云游戏服务器,Arm方案可能是最佳方向。NVIDIA GeForce高级副总裁Jeff Fisher谈道:“移动游戏是最大且增长最快的游戏市场,已有数千部游戏针对Arm指令集进行了优化。”

目前传统云服务大量采购x86的传统服务器。但手游基本占70%以上的游戏市场,而且在手机市场,安卓系统占了大部分市场份额,在中国的市占率76%以上。如果在传统的x86服务器上运行安卓游戏,会产生指令集兼容性的问题,在指令集翻译的过程中,无可避免地会产生效率的损耗,原来的算力优势会大打折扣。

这也是为什么基于Arm架构的云原生服务器,可能是云游戏服务器更好的选择。它可以覆盖最大范围的应用市场,来自终端、天然的云端和边端同构的属性带来很多优势,比如性能效率的无损、软件开发环境和工具链的一致性、跨设备可迁移性等等。

目前在国内,Ampere CPU+NVIDIA的GPU的硬件服务器已广泛在公有云上部署,如果一个用户想快速构建与拓展安卓云游戏的业务能力,可以直接上云,用公有云的数据中心的算力资源。

三、安卓云游戏的三大算力需求

安卓云游戏对算力需求主要在三个方面:一是安卓系统的容器化能力,每个容器将承载一个或多个安卓系统和游戏应用,二是游戏渲染能力,三是视频流编码能力,在服务器配置和选择时,这三个核心算力要根据所需承载的游戏的密度、视频流、质量等方面进行平衡。

这对CPU和GPU性能有更高的要求。CPU很大程度上决定了一台服务器同时并发可以运行多少个安卓云游戏的实例,游戏渲染和视频流编码能力则需依赖GPU则实现。

对此,Ampere在技术上不断迭代,单颗Ampere Altra Max的CPU已达到128核,双路则可以到256核,基于软件平台在200多核的服务器运行,这是决定它高密度的一大基础。针对游戏画面渲染,NVIDIA做了大量工作,单T4可支持32路的游戏并发,下一代还引入更高密度A16 GPU,渲染能力、编码能力均比T4增强几倍。在“Ampere CPU+NVIDIA GPU”的加持下,单台服务器可实现160路超高密度并发的云游戏能力。

对于性能和密度不同的CPU,搭配GPU的数量应是适当的,才能达到最佳的性价比配置,将CPU和GPU的能力发挥到最好。

“凭借Ampere Altra Max领先的核密度,单机架AICAN服务器可以同时向大约2500多个移动用户传输串流。这不仅使得广大消费者更容易从云端流式传输优质移动游戏,也同时首次为服务提供商提供极具竞争力的基础设施成本。”Ampere Computing首席产品官Jeff Wittich谈道。

Ampere Altra系列处理器采用高性能内核,最高主频可以达到3.0 Ghz以上,每个内核的L1和L2的缓存是独享的,相较终端SoC内核性能大幅领先。Altra系列处理器的内核采用单线程设计,功耗设计非常出色,所有内核能同时以最大主频运行,每个内核的性能非常稳定,可进行线性扩展,从而能保证所有的游戏实例表现稳定,不会因为某一个单个CPU上运行的游戏数量或者游戏负载轻重的变化而出现波动,这对于保持用户服务的一致性、达到指定的SLA很重要。

此外,Ampere Altra处理器的核数是目前业内最高的,可支撑最大密度云游戏的实例密度,同时可以最大化释放GPU的算力。再加上丰富的PCIe接口,Ampere Altra处理器能与GPU组成高密度、高效互连的GPU云平台。Ampere Altra处理器也是当前市场上唯一能同时原生支持32位和64位应用的处理器。

孙开本透露说,Ampere正在和很多云游戏厂家建立紧密合作,共同建立云游的生态,希望打造一个由“Ampere云原生CPU+NVIDIA高性能GPU+NVIDIA云游开发包SDK”,形成一个“三叉戟式”的云游戏平台,助力云游戏的快速发展。

四、让安卓云游戏体验更佳,背后的软硬件优化

NVIDIA中国区高级云游戏解决方案架构师张洁分享了更多构建AICAN平台的细节与。NVIDIA在AICAN平台上搭建了一个安卓的云游戏堆栈,配合整个硬件提供给用户,实现开箱即用。用户可以基于其参考设计,快速构建云游戏平台,从而大幅减少在构建云游戏平台时可能遇到的问题和大量工程化的实践。

其云游戏堆栈可提供最高的密度和服务质量,专为低延迟端到端渲染、编码和流式传输进行了优化。NVIDIA还专门成立了专业工程和质量保证团队,使其合作伙伴能轻松快速地进行集成并满足所有最新游戏的需求。NVIDIA ConnectX SmartNIC或BlueField DPU网络解决方案通过流畅的流式传输与高服务质量完善了该平台。

硬件方面,NVIDIA提供了高密度原生的安卓云游戏能力,在方便满足用户体验的同时来保证成本,需通过软硬件协同优化来不断降低单路用户的成本,助力云游戏的规模化部署。

NVIDIA GPU的一大特色是同时集成了编码和解码的核心。在A16 GPU上,如果以H.264进行编码,720P 30帧的画面可达182路;如果游戏用户追求更高、更顺滑的画质体验,帧率提升得更高,在1080P 60帧可以做到45路。这两点基本保证了它能支持重度游戏,而且游戏画面能非常方便地直接编码后串流到用户本地,不需要把编码工作和GPU分开,使得延迟更低。

针对游戏对显存的需求,A16 GPU拥有64GB显存,使得更多更重度、更精品、更高端的游戏可以放到数据中心端。除了在游戏上有很好的积累和生态以外,其GPU还可以支持人工智能及光线追踪的专门硬件单元。

上层的软件栈中有GPU的云游戏Driver,再往上是Android Container,就是将安卓进行了容器化,然后在安卓内做了NVIDIA GPU图形的能力支持。正常调用NVIDIA GPU后,游戏渲染出的画面可通过NVIDIA Android Cloud SDK。SDK里提供了很多案例,用户可参考“软件+硬件”平台去快速构建安卓云游戏平台,快速实现业务扩展。

为了确保性能,让安卓云游戏可以原生调用其GPU,NVIDIA在软件上做了特殊支持,GPU的渲染、编解码能力也移植到安卓内,在安卓云化过程中可以有效地保证应用程序的兼容性。其软件平台上已经验证了超过200款以上业内主流游戏,NVIDIA后端也有很大的安卓团队来支持兼容性问题的解决及优化,可以为安卓云游戏的用户在兼容性上做保驾护航。NVIDIA还与一些工作室合作将人工智能和高端渲染的能力带到安卓游戏的生态,以更好地增强游戏画质,提升用户体验。

结语:探索云游戏解决方案

Ampere Computing和NVIDIA共同对AICAN平台进行认证和支持,使云服务提供商和游戏开发商可以轻松构建和运营大规模的游戏串流服务。

NVIDIA既有硬件平台持续迭代的能力,去支撑高密度、高用户体验的云游的能力,也匹配高效的软件栈,辅助用户快速实现自己的安卓云游戏,大大缩短在软件层面构建的时间。当前,浪潮、华勤等多家领先的OEM服务器制造商都在构建AICAN服务器平台。