海马云战略副总裁许琳主题为《从云游戏到元宇宙,云原生的思考与探索》的演讲实录:

2021年,随着“元宇宙第一股”Roblox的上市,以及,这个源于科幻小说《雪崩》中的未来概念逐渐为人所知。元宇宙(Metaverse)已然成为投资圈讨论最为火热的赛道,但建设这样一个宏大的、高自由度的、极具幻想色彩的虚拟世界,需要AI、内容创作引擎、内容生态、网络通讯技术、AR/VR生态、区块链等不同领域的解决方案共同完成。国内方面,受元宇宙概念兴起的影响,以及字节跳动、网易、五源资本等互联网企业和投资机构的入场,一批处于元宇宙生态中的初创企业水涨船高。在内容创作引擎、AR/VR和AI领域中,由于相关技术在国内的稀缺性、复杂性,部分企业在产品并未完成的阶段便获得了极高估值。

那么元宇宙究竟是泡沫还是真实的未来?36氪于11月24日在深圳举办了超前体验·元宇宙峰会。此次峰会邀请了众多投资人、学者和产业创变者,包括北京航空航天大学教授、国聘互链网专家蔡维德,海马云战略副总裁许琳,STEPVR总裁郭成,「Soul」CEO特别助理黄子扬,赤子城科技副总裁何维,EM3联合创始人兼CTO宋磊,网易伏羲实验室联席负责人李仁杰,腾讯幻核市场负责人杜政霖等多位嘉宾,共同探讨元宇宙产业的发展新趋势。在元宇宙与机器人前景可期的趋势下,36氪将通过最前沿的视野持续关注该领域,为该行业提供全面的支持。相信在元宇宙的布局下,36氪亦将探索出新的增长空间。

在本次元宇宙大会上海马云战略副总裁许琳进行了独立演讲,在演讲中他认为元宇宙有个非常重要的特点,即是沉浸感和超低延时,就是如何在体验、效果和延时之间去提供一个非常好的技术基础。对于元宇宙来说,因为虚拟现实、增强现实对于延时的要求,以及整个3D的内容,对于算力的要求和实时性的要求,都是远超目前云游戏现状的。

以下为海马云战略副总裁许琳主题为《从云游戏到元宇宙,云原生的思考与探索》的演讲实录:

我今天分享的这个题目叫从云游戏到元宇宙。

先简单介绍一下我们,我们叫海马云。我们是为实时互动内容提供基础设施的,实时互动内容现阶段最主要的一个代表就是云游戏,当然未来我们认为元宇宙也是这个实时互动内容的一个非常典型的代表。

现阶段我们是国内最大的为云游戏提供算力的基础设施提供商,我们专注做企业服务,所以说在用户端其实我们基本没有什么名气,但是在企业端几乎国内做云游戏的公司都是海马云的客户。我们有一个全栈自研的方案,从底层到上层,我们支持了ARM和X86的混合架构组网,也就是说我们能够为所有的游戏内容都提供云计算的服务和云游戏的服务。

我们发展到现在,在全国建成了一张覆盖到各省的最大的云游戏边缘计算网络,我们平台每月的独立用户数超过了3500万,峰值的并发用户数超过了25万,这是目前国内最大的一个云游戏计算平台。

我们的愿景是未来为元宇宙提供一个云原生的解决方案和相关基础设施的服务。

我们如何去考虑云游戏跟元宇宙之间的关系?

今年元宇宙火了以后,其实业界有一个共识,就是从技术形态上面看,云游戏其实跟元宇宙的相似度应该是最高的。但是像类似我们云游戏的从业者,我们并没有很大张旗鼓去宣传元宇宙,因为我们觉得从技术角度出发,元宇宙可能还要解决非常多的技术问题。我们在做云游戏的时候,现阶段我们做云游戏,技术上我们做什么事?我们最核心的做的事儿就是把存量游戏上云,把它流媒体化,然后通过实时音视频互动,让玩家能够玩到游戏。

我们在做这个工作的过程中,我们要从技术上考虑一些问题,比如说我们在画质和延时之间如何做平衡

业界都知道云游戏的火爆是得益于5G的商用,从2019年开始。但实际上5G发展到现在,低时延网络的基础设施其实还没有完全做好,所以我们现在做云游戏的时候我们会面临到网络环境的复杂,我们在一个特别复杂的环境里去平衡画质和延时,这个是受限于底层的网络能力。我们同时还要考虑体验和成本,体验无非就是清晰度、分辨率,成本很核心一点有个带宽消耗的问题,所以说其实也会回到说如何我们在技术端去平衡画质、带宽消耗、延时等等问题。

所有这些底层的技术底座,一个是算力一个是网络,海马云我们是做算力的,我们要架在一个基础网络设施上,所以我们在全国会自己建边缘节点,我们会用到基础运营商的服务,来实现整个的技术架构。

在这个基础上,我们在思考一个方向叫云原生,就是如何让游戏从设计、创意和研发过程中,就能适应一个云游戏的架构。这个方向业界目前正在做一些探索,还没有形成很多共识,也没有看到非常多的成果,可能目前我们能看到的在云游戏领域的成果,只是说在整个画质的精度、资源包的大小,以及对算力消耗层面,可能针对云游戏会做一个专门的编译包,来更好的利用云游戏的算力为玩家提供更好的服务。

但是从整个游戏的设计架构上并没有太多的改变,这一点后面的片子也会谈到为什么是现在这个状态。

我们现在讲元宇宙的时候,有各种各样的概念,各种各样的定义,我们从技术角度看元宇宙的时候,我们首先认为元宇宙代表了下一代互联网的一些基本形态,我们认为到了元宇宙阶段,可能整个消费者接触互联网的入口就会有新的变化,可能是一个虚拟设备,一个体感设备,进入的可能是一个虚拟的空间,是一个3D的空间,也有可能是像虚实结合那样的一个AR的混合现实的空间。我们认为是下一代互联网一些基本形态的变化。

这个过程中,从上层逻辑来看,元宇宙首先是开放的,我们不太认为一个企业有能力建一个覆盖全球所有玩家的元宇宙,因为这背后带来的算力消耗和所有数字内容的生产过程中的投入,应该不会是任何一个企业能够独立完成的。

在开放性的基础上,大家会去定义标准,会有广大的产业链的参与者来共同去构建元宇宙的内容和生态。在里面有些比较重要的,我们可能会涉及到的点,一个就是虚拟身份和社交性,但是虚拟身份的底层可能是NFT、NFR,上层是数字人,是一个虚拟形象,这里面我们会带来完全不一样的,在虚拟空间中以虚拟身份进行社交的一些基本的体验。

这里面当然还有经济系统,不能回避的一个事儿就是经济系统。

我们从技术角度我们再来看元宇宙有个非常重要的特点,叫做沉浸感和超低延时,其实这个事儿在云游戏我们已经遇到了,就是如何在体验、效果和延时之间去提供一个非常好的技术基础。对于元宇宙来说,因为虚拟现实、增强现实对于延时的要求,以及整个3D的内容,对于算力的要求和实时性的要求,都是远超目前云游戏现状的。所以从这个角度出发,我们会认为对于基础设施会有非常大的挑战。同样,它的基础设施除了AI,除了区块链,很核心的一块还是算力和网络,我们如何为元宇宙的沉浸感的内容和超低延时的要求去提供底层算力和网络?这一块其实是我们正在思考和做探索的。

当然,同样面临着云原生,面临着如何在云原生的语境下去定义基础设施、定义上层生态。

刚才我们讲了元宇宙因为它有沉浸感、超低延时,有一个非常高精度的对现实世界的一个建模,有虚实结合的沉浸体验,那么它对基础设施的要求应该是什么样的?这块基础设施其实我们会专指我们关心的算力这部分基础设施,我们认为对算力的要求应该是有这么几个特点:

特点一,协同计算。元宇宙内容的渲染精度和渲染复杂性应该会超出任何一张单张显卡或者单机的性能,而且就算按照半导体的发展速度,在可见的未来,也不可能用单张显卡能够搞定元宇宙这样级别的一个渲染,所以我们一定会在集群的协同计算上要有很多算法的突破,这一块不仅要多卡,还要实现跨物理机,甚至未来要跨物理节点,在一个覆盖全国算力的网络上去做协同计算。这块会面临很多的挑战,包括底层的,包括算法的,包括引擎层面的事儿。

特点二,实时性。所有的渲染、计算必须要保证实时,因为未来元宇宙一定是实时内容,内容是实时生成的,会根据用户的交互实时产生内容。所以说任何之前的工业标准在元宇宙的语境下可能都会面临很大的挑战,因为实时性对于整个算法的优化,对于底层架构的构建是完全不一样的。

我们认为按照实时性和协同计算的要求,未来整个算力一定是个分布式的网络,是一个覆盖到中心、边缘,甚至端侧协同的一个分布式的算力网络,然后我们认为这块整个基础设施是基于云原生的理念来构建的,因为只有基于云原生理念我们才可能做到性能、成本足够的优化,能够满足未来整个元宇宙发展的底层的设施的要求。

这里面我们在讨论基础设施构建的时候,会面临很多关键的技术:

第一块,我们觉得应该要定义云原生的GPU,现有的显卡在整个定义上它本质上还是按照工作站单机的角度去定义的,就算把现在的显卡放到服务器侧,这个架构的优化本身它并没有专为云原生,专为元宇宙的需求去做优化,所以说在性能和成本上其实并不是最优的。我们认为在这一块未来要满足整个元宇宙基础设施,整个计算集群的要求,在GPU的设计上从一开始就要考虑到为云原生来优化,比如说渲染和编码,我们如何在芯片层能够直接把它搞定,在整个的IO和内存层面我们如何消除一些数据搬运的瓶颈,这些都是在GPU设计层面要思考的。我们也正在和国内的GPU团队在探讨,如何去定义未来基于元宇宙的云原生GPU。

第二块,服务器一定是高度定制化的,考虑算力的密度、功耗、体积等等,要有一个足够高的性价比来来支撑上层的业务。

在整个基础设施里面有一个很重要的点就是网络,因为我们要实现跨物理节点,跨IDC节点的协同计算,数据的搬运和吞吐对网络的传输和延时要求会非常的高,现有的网络应该很难满足这么大量的协同计算的要求。所以说运营商那边也正在规划一个叫算力网络的东西,在规划中应该是要构建一个基于全光交换的网络底座,来实现整个物理节点之间的互联。

那么硬件层构建完以后,软件层面我们刚刚讲到了协同渲染,涉及到图形接口、引擎等等一系列工作要重新去定义。然后上层还会有基于AI的内容生成来解决元宇宙整个环境下大量的3D内容如何去构建,如何去产生的问题。

整个底层做完我们还需要一套云原生的工具包,为整个开发生态、使用生态、消费者生态和生产者生态提供一套基于云原生语境的开发包,能够让广大产业链的参与者能够在整个元宇宙的基础设施上做内容的开发,做内容的构建。

所以说海马云我们正在思考要建一个元宇宙的开放平台,我们正在去做内部很多的研发和规划的考虑,也在做一些技术的储备。我们设想中整个元宇宙,基于云原生的开放平台应该是这么一个架构,底层是算力和网络,中间那一层是我们所谓的协同计算、协同渲染引擎,上层是所有的应用。我们在云原生语境上,让上层的应用开发所见即所得,因为按照元宇宙的语境来看待内容,现有的工作站的开发模式其实很难实现所见即所得,它本身的算力会超出本地能够支撑的极限,所以说我们基于分布式的算力和网络,然后再做一层通用的渲染引擎,在上层再来提供整个元宇宙的工具包。

这里面包括几个点,第一个点就是开发者工具,我们如何让这个行业产业链共同参与,来构建元宇宙的内容,不管是生成数字人的虚拟形象,还是生成元宇宙的场景内容,或者是生成一些其他的元宇宙里面用得到的内容,我们需要有一套给开发者的工具包,然后基于底层的算力直接在云上做开发。

整个开发出来以后,应该我们要有一套部署的工具,把整个应用直接部署到云上,向消费者能够提供访问。我们会直接把渲染和推流这部分在后台提供相关的工具,让所有开发出来的应用,元宇宙的应用都能直接把它流化,渲染出来,把结果直接推出来。

这里面还涉及到应用更新,就是所有的应用都会有迭代有更新,更新的时候我们如何在整个的分布架构里面去做部署,做分布式架构下的实时更新。

所以最后我们把这些全部做完以后,我们会定义接口SDK,然后让上层的业务层和整个生态能够很便捷的访问到底层的算力和网络,以及所有工具的这些基础设施,这是我们正在做的事儿。这个事儿肯定也是需要跟产业链共同来协同,所以说我们也在广交朋友,跟产业链各方在讨论如何去把整个元宇宙需要的技术构建到一个开放平台上。

这里面我们也面临了一些底层架构的思考,一些具体的技术点,在今天这个机会也是分享出来,跟大家一块来探讨。

第一个就是底层架构选择上,我们现在比较了很多的路线,我们最后认为我们还是要拥抱开放社区、开源社区,所以我们决定选到ARM+Linux+Vulkan的这么一套体系,去构建整个底座,就是包括芯片层、硬件层,包括操作系统,包括图形接口。好处在于其实这三块东西都有一个很成熟的开源社区正在做演进,我们只需要借助开源社区的力量,进一步的往协同计算、往元宇宙方向去做技术推进。

这里面还有一个更重要的点,就是云原生下的CS架构的部署问题。

这个事儿我们在考虑云原生语境的时候,其实在考虑整个应用开发的工业标准,比如说在互联网时代,大家其实逐渐抛弃了CS架构转向了BS架构,因为BS架构非常易于部署,BS架构上云其实非常简单,因为所有的S直接部署到云上就可以了,客户那边是个瘦终端,他只是一个浏览器。到了移动互联网时代,开始做APP以后,又会把CS架构放到一个主要的开发的方式上来,CS架构典型的就是游戏,我们在做云游戏云化的时候,就会面临到CS架构整个体系在C端的算力如何在云上做卸载的问题。

这里面其实有很多算力我们可以通过CS的分工来调整,让这个算力全部卸载在服务端。比如说像区块链的算力、像AI的算力等等,其实都是可以去卸载到服务端。但唯有一个算力是很难卸载,就是渲染,因为你最后渲染这一侧跟用户侧看到的东西和显示是直接相关的,所以说我们在做云游戏的时候,我们只能用Streaming的方式来解决渲染这侧算力如何卸载到服务端。因为最终用户必须看到一个图形界面,对元宇宙同样的,你不管怎么做服务端算力的调整,你最终用户要看到一个虚实结合沉浸式的场景,目前涉及到的图形算力云化只能用流化方案去解决。

所以这就是我们认为说在这个语境下,我们在看待未来整个元宇宙上云以后,或者在云原生语境下我们考虑元宇宙开发方式的时候,我们怎么去解决这个问题。这块我们的基本思考是说,不管怎么做,渲染部分最后一定会卸载到一个分布式的架构上,保证渲染的算力离用户足够近,保证一个很低的时延,所以说这一侧仍然会考虑到有分布式部署和分布式更新的问题,就涉及到一系列跟分布式有关的底层工作要做,比如说大带宽、大容量的分布式存储,去解决整个边缘网络的应用更新问题。

第三块我们在考虑未来我们整个底层的成本我们能做成什么样?因为云游戏我们发展到现在,其实对于商业模型来说有一个比较大的点,就是如何去节省成本?我们通过计算架构的定制能够很好的定义一个高性能的方案、高性价比的方案,那么对于元宇宙我们能把成本压缩到什么情况?当然第一个我们会想到是说,如果说我们做了协同渲染,是不是有些内容我们只用渲染一次,但是可以供所有人看到它的结果,这样其实我们就会让整个算力不是线性增长,当用户量上去以后,算力会是一个缓慢的增长,这样我们就可以控制边际成本来增加利润。

实际上我们做到现在,我们会发觉基于算法层面的共享,可能对于算力的节省其实是有限的,在于是说每个人看到的视角都不一样,在图形学上,你其实很难说一次渲染解决所有的问题,因为它要跟每个人的视角、每个人推流摄像头的位置是有关的。但是这块你说能不能节省?我认为是能节省的,但是节省量不会像想象那么大。

那未来这块的成本我们怎么压缩?我们认为还是要回到底层半导体的突破上,比如说我们国产的云原生的GPU能够出来,这一块对于现在整个行业受限于两家国外GPU厂商的格局就会有很大的改变,可能在这一块对于未来整个基础设施的成本节约和能力提升,是一个非常重要的点。

以上是我的一些分享,代表我们一些简单思考,抛砖引玉,我们也期待跟整个产业链共同探讨未来元宇宙技术的演进。

文章只代表原作者观点,边缘云致力于打造独立、客观的资讯信息平台,转载请注明来源于边缘云信息平台。
分享到
长按二维码关注

参与讨论 抢沙发

评论前必须登录!

立即登录   注册

边缘云生态研究

关于我们