您的位置首页  科技资讯  新闻

金山云梁守星:沉浸式将对视频的编解码和传输带来巨大挑战

出品 | 搜狐科技

编辑 | 宋婉心

10月14日,第八届中国网络视听大会在成都举办,会上,金山云高级副总裁、合伙人梁守星发表主题为《智享沉浸视界》的演讲,并同金山云 CDN 及视频云产品中心总经理宗劼一同接受了包括搜狐科技在内的媒体采访。

宗劼表示,疫情以来,客户对互动视频的需求出现较大增长,包括在线教育、在线直播、在线医疗、在线问诊,这些对于常规互动来说,都提出了比较高的要求。此外,高清的技术需求即将迎来高点,“当下欠发展的原因,其实还是跟成本相关,受制于现在屏幕的能力,现在大部分手机其实就是1K屏或者2K屏,比较好的是2K屏,但是我们认为,未来不管是手机屏,还是多屏互动,包括电视4K,普及之后会迎来高峰。”

去年年底,金山云视频云明确了“向上AI化”和“向下边缘化”发展方向。向上AI主要是帮助用户提升画质,降低成本,金山云AI产品系列主要包括集智高清、KIE、KAV1、画质评测等;向下边缘,则涉及更大容量、深度边缘和开放边缘计算三大方面。

梁守星透露,金山云对视频云团队进行了升级,成立了独立的互动视频团队,“原来视频云主要负责转码、视频编码的探索和研究,但现在视频云会把底层技术和AI技术相结合,让整个视频云变成更加智能的视频云。”

根据美国Sandvine统计数据,2019年全球互联网视频流量占比61%;另据统计在我国互联网视频流量占比更是高达80%。得益于此,我国视频云行业规模同样水涨船高,易观方舟统计,我国视频云规模增长率逐年提高,2019年视频云市场规模达到134亿元,较上一年增长47%。

以下为采访实录:

记者:今年以来疫情催生了云经济,诞生了很多线上办公、线上娱乐,这其中也包括视频行业,随着5G、AI这些技术的落地,您觉得视频云会迎来怎样的发展机遇?

梁守星:移动互联网的视频走到今天,整个流量或者DAU峰值已经到了很平稳的趋势,没有像前几年的高速增长和高速爆发,我们了解到视频已经下沉到四五线城市。对5G来讲,疫情是推动了互动式视频的增长,为什么说是互动视频,包括在线办公、在线会议,甚至还有最近年初很流行的云发布、云会议。所以在5G关口,我们会看到5G的核心技术是高并发和低延时,恰恰促进了、也符合了互动式视频的发展,所以我觉得未来2-3年,互动式视频会逐渐成为主流的视频方式。

5G会催生什么,就是固网带宽的升级,所以会带来大流量的视频和高清类型、互动类型的视频,还有VR虚实结合的视频会大量涌现。我们看到在很多直播,或者短视频平台上,其实内容制作的方式已经很多元化,包括AR、VR的,这些元素的加入会促进内容的多元化,对于现在的UGC、PGC,内容制作上也会提高很多质量。包括爱奇艺和腾讯视频都在做这些视频,这些视频更多还是专业团队做的,但是在未来我觉得会有草根团队开始做这些视频,包括大家看到,B站里边的UP主视频内容更加多元和丰富。

记者:您谈到视频流量从之前的野蛮生长到现在平稳阶段,向下走跟各行业结合,面对这样的市场变化,金山云整体的规划是怎样的?可以从战略层面以及竞争的策略,以及组织架构和业务划分这些层面来谈一谈金山云的规划。

梁守星:宗总管的视频云和CDN业务,我们去年年底就在思考接下来视频云会有什么变化,我们在里边组建了几个团队,或者说升级了几个团队。去年我们就已经开始做边缘计算的布局,边缘计算的布局主要在于边缘视频云的探索。为什么呢?当视频段越来越多的时候,你在中央计算上转码或者分发的时候,它的压力会非常大。所以我们本身有一家很大的全国的CDN或者全球的CDN网络,这种情况下我们就可以利用边缘节点解决很多视频在预处理上的事情。比如说我们做AI项目的时候,视频传上来是非结构化的数据,要提取某些元素的时候,会把某些结构化的数据提出来,然后再放在中央做计算,就是边缘会做很多的视频预处理。

第二个,我们在互动视频上投入比较多,特别是这两年把互动视频和AI结合更紧密,我们内部会有一个专门的视频云部门,原来视频云主要负责转码、视频编码的探索和研究,但现在视频云会把底层技术和AI技术相结合,让整个视频云变成更加智能的视频云。前几年我们有做图像识别等这样的技术探索,所以现在会把这个东西跟编码的能力相结合,未来我们可以看到,就是当4K视频开始真正在手机上播放,或者在VR设备上播放的时候,它的传输带宽需要很大,这块的核心能力,在编码如果做到有效编码的话。我们会做一些,甚至比265更先进的编码技术的时候,它的压缩比会更低,可能传输的整个的成本只是原来的1/3,会大大提升视频应用或者视频内容更高清化的普及。

第三个,我们主要做的针对互动视频的探索,现在也专门有互动视频的团队,它除了标准的方案,还有视频互动内容的探索,这关系到视频、音频,包括人脸、手势,这些互动视频的探索,更核心的是,视频原有的团队是下沉了更深一层做AR、VR的编码探索,因为AR、VR的编码探索跟现在平面视频探索不一样,所以我们视频云组成了一个矩阵,从底层的传输到PaaS层的应用,甚至到SaaS层真正的直接交付,这样一整套的视频云服务。

记者:我们现在做视频云在哪个行业最赚钱,以及跟这些行业结合中,现在的挑战有哪些?

梁守星:说起赚钱,一部分是说流水够不够大,另外是毛利率够不够高,行业不一样。互联网这些行业来说,它是主要流量跟技术的积累为主的,它会有大流量,但是你说到教育跟电商这部分。特别教育这部分,教育的行业是特别有意思的行业,因为它不像互联网的抖音、快手,或者B站,用户累积会慢慢慢慢加多。比如考公务员,今年几百万到一千万人考,明年还是这几百万到一千万,教育来讲每年它的用户规模不会突然间变庞大,只不过它的学习的方式会更互联网化而已。

前几年我们可以看到教育行业,包括VIPKID,跟谁学,这些用户的增长,是在于原来没有用互联网教育的学生用了互联网教育,它才有爆发式的增长,但是它有一个瓶颈,每年的用户群体就这么多。学完一年级,除了留级的,没有人再看一年级的课本,但是它会有新生来,所以每年群体都是这样的一个类型。所以对于教育来讲,是收益比较好的一个行业。

直播电商现在主要的平台,除了淘宝之外,其实大部分都在视频平台上跑,还是先有内容然后才能带货。我上段时间特意看了一个直播电商的运营模式,说先有流量还是先有卖货,其实两者得先有流量,还是先做内容,把内容做出来之后,把流量做出来,然后再去再卖货,卖货好以后再跟商家拿低价的东西,是一个循环过程,但必须先有流量,所以对于直播电商来讲还是流量为主的方式,还是互联网运营化的方式。

记者:上半年金山云正式发布了一个高清画质评测平台魔镜,使用效果怎么样?魔镜目前有没有最新的进展?

宗劼:魔镜是我们金山云构建视频生态链条当中非常重要的点,因为我们认为这是一个关键的入口,我们从整个构建初期,要实现几个目的。

首先是可以让用户对他的视频管理和视频评价成为一个体系化,通过我们平台可以非常方便对它的视频进行各种方式的评价、评估。另外,我们的魔镜内置集成了多种客观的评价指标,核心的评价指标就是无参考。因为我们魔镜的出发点就是基于愉悦感知度的评价,对于无参考的评价指标来说,可以非常方便直接看你这个画质是不是让用户感觉舒服和有比较良好的感知性。

我们最初出发点的第二个点,就是我们可以很好把我们客观评价指标集成在里边。第三,我们通过客观的评价指标,我们同时在魔镜当中集成了人工的评审和评估,我们跟很多用户沟通,他其实可以先用这个客观评估,筛选之后再转给评估,这样让魔镜整个运行效率,或者客户使用之后可以运行效率更高,可以挑出来哪些是感知感觉度更好的。

记者:刚才你提到我们过去视频云升级了几个团队,方向是互动式视频还有沉浸式视频上,想问一下您怎么看待这种沉浸式视频未来的发展趋势,金山云在这方面有哪些布局和规划?

梁守星:现在流量大的是长视频聚集型的,另外是短视频,大家可能在抖音上刷几个小时,在我们金山云内部讨论和头脑风暴里认为视频还是初期阶段,现在的初期阶段还是大家拿着手机在看,或者在电视、电脑、PAD屏上看,但家里应该有第二块屏,就是VR屏或者MR的屏,这样才会让你更深感受到视频的变化。

比如MR有一个广告,你实际不是在看电影,是在参与电影,这样的感觉。现在的整个硬件,包括网络,包括传输,这些趋势的情况下,接下来对于沉浸式视频的内容会逐渐开始出现,这是一种。

第二个是什么呢?我们觉得未来的视频不单单是现在看到的视频,而是所有的东西都会云化,比如我们现在做的云游戏,云游戏是特别合适放在VR上应用的,因为VR设备大家也知道,现在有续航能力的问题,未来可沉浸式视频应用的范畴是非常多的,包括游戏类的,包括会议,包括学习,包括沉浸式视频里边它可以更容易实现这些更好的视频的展示效果,也会给民众或者大家更好的云视频体验。

记者:你刚才谈到不同的技术类型,比如交付沉浸性的,包括VR,包括互动式体验,想知道客户端的需求来看,哪种技术或者产品是需求最大的?

宗劼:我们认为从未来整个架构来说,这几块都会包括,从现在来看疫情之后,互动是比较大的增长,因为在互动方面,我们认为包括在线教育,包括一些在线直播,实际上都对互动有很大的影响,包括一些在线医疗、在线问诊,这些对于常规互动来说都是提出了比较高的要求,所以这块现在是增长比较快的。

另外,高清我们现在认为很大的一个点其实还是跟成本相关的,还有是受制于现在屏幕的能力,大家都知道现在大部分手机其实就是1K屏或者2K屏,比较好的是2K屏,对于高清现在并不是太强的需求,但是我们认为未来不管是手机屏,还是多屏互动,包括电视、4K,其实已经比较普及了,包括很快到来的8K。所以我们认为从未来的角度来看,高清是一个更快发展达到的点。

记者:行业竞争方面你说到差异化,你觉得金山云和其他厂商来说是不是技术方面没有太多差异,差异主要是在规模上?

梁守星:我觉得规模是云计算很重要的一点,因为云计算有两个关要过,很早以前我们做金山云的时候,做云计算的时候,内部定了一个规矩。第一是技术关要过,就是你所有的云计算都是由技术云做起来的,但是技术关过完没有用,这是第一个关,第二个关是规模关,云计算的普及在于它的规模化的普及,因为规模化的普及才能决定成本,才能做到最优,才能做到最好普惠到用户,不是纯技术或者纯规模的问题。

我觉得金山云在整个云计算的判断上,我们实际跟其他云厂商比起来,唯一最重要的一点是我们很专注和很垂直在特定领域。我们最早做游戏云,实际只做游戏客户,也专门为游戏客户设计了云化的框架,专门针对游戏高并发的框架。在整个行业深度里边我们也是足够提早布局,也是认定了这个事情,我们就会深入地去投入和做,这样才会形成逐渐的优势。

记者:视频云业务最早在金山云内部诞生的时候,我们当时对这个业务的判断是什么?二位也谈到我们眼下的直播、教育,其实都火了,这个业务目前二位经历的变化,能不能谈一些感受?

梁守星:我算经历了金山云视频云开始组建到现在规模这么大的全过程,最早是游戏云,包括标准的云计算,我们讨论视频的时候,核心是来自于几个数据的支撑。当时我们做存储,存储数据早期都是照片,就是手机最早大家拍的都是照片,但是在2014年底、2015年初,存储的层面开始产生变化,就从照片逐渐变成视频。为什么?

整个中国我们会发现,我们有一个断档期,在国外大家家里很普及一个东西,除了相机以外,还有一个是摄像机的东西,但中国没有普及过摄像机,就是中国只有照相器材没有摄像器材的普及,导致中国人有手机之后真正能拍视频之后就大规模增长,这是当时我们的判断,因为有一个断档期。但是视频在海外,在国外,是很普及的东西,包括最早大家看Youtube,包括看相关的内容视频,都是自制的,因为那时候有普及。所以我们当时判断手机摄像头可以拍视频的情况下,手机存储足够大的时候,一定会拍视频,但当时没有想到视频怎么用。

第二,正好14、15年的时候,从长视频的内容,到短视频内容的过渡,因为有人开始拍摄了,实际制作长视频是一个很耗成本和很耗人力的问题,但是短视频一个人可以编辑搞定的。所以我们认为移动互联网是短视频主导长视频为辅的增长方式,所以我们当时决定开始做视频云,这是第一个阶段。

2015年下半年迎来第一波移动直播的兴起。当时我们没有想到移动直播这么快,所以移动直播视频的兴起,导致我们当时正好有一整套的直播编码方案,直接就丢进去可以用,所以就迎接来第一波流量的增长。然后到第二波是什么?第二波就是抖音跟快手的增长,就是短视频的增长,就迎来第二波高速增长。

移动互联网里边,现在的主要流量来自短视频和移动直播,长视频的主导流量不多,因为大家很多是下载到手机来看,需要大块时间。

免责声明:本站所有信息均搜集自互联网,并不代表本站观点,本站不对其真实合法性负责。如有信息侵犯了您的权益,请告知,本站将立刻处理。联系QQ:1640731186