专访搜狗王小川:自然交互、知识计算是搜狗两大核心理念
出品|搜狐科技
作者|宋婉心
编辑|
5月17日,2021搜狐科技5G&AI峰会在北京隆重召开。搜狗CEO王小川作为嘉宾,现场联合搜狐新闻发布了搜狐新闻24小时数字人,并发表主题演讲,分享数字人背后的新技术。随后,他接受了搜狐科技的专访,针对数字人技术亮点,以及搜狗最新的人工智能研发成果进行了详细解答。
谈到推出“数字人”的初衷,王小川指出,源头是搜狗基因里涵盖着搜索,表达了知识获取、和人对话的能力,输入法更强调沟通,输入法和搜索背后的原始核心都是强调的语言。
相比于此前发布的AI合成主播雅妮,王小川表示,最大的变化是从2D变成3D,“雅妮是2D形象的,动的时候也只是面对镜头的移动,到3D之后有不同的视角来拍你的人形,你可以旋转你的机位来看,手势有更大范围的表达。”
王小川透露,接下来,主播的成熟到推广背后仍有很多工作要做,包括不断提升它的流畅度、更高的理解能力,以及在更多的场景落地。
以下为专访实录精编:
搜狐科技:川总您好,刚刚发布了数字人技术,背后有哪些亮点?
王小川:首先,数字人技术不仅在中国,在全球也是足够领先的,我们七代的产品发布都走在了行业的前面,引领了大家的关注和后面的模仿学习。因此,从最早的一个表情到全方位能够从坐起来、站起来,有手势、有多模态的互动,把人工智能非常多的技术用进去了,也是落地人工智能产品之间比较亮眼的一个。
搜狐科技:这一技术在实现过程中有没有难度,或者一些研发历程可以分享一下?
王小川:这个很有意思,最早的时候,我们也在做语音识别,国内的技术非常好,我们就把搜狗的技术实力展示出来,在互动里面不仅只是基于文字和语音,我们研发了唇语识别,通过嘴唇运动识别你说的什么内容,积累了大量的经验。
反过来,我们开始构建唇形的合成,通过你的语音把它变成表情,变成你的唇动,从语音合成走向了视觉合成,这个我们走得非常领先的,缘起来自于从语音到唇语到合成,因此的话,大概2018年开始,首先和新华社有了第一次的合作。就这个事情的难度而言,随着从2D到3D,包括肢体到表情有含义变得越来越难。
搜狐科技:更新版的数字人和之前发布的雅妮有没有什么区别,有怎样的进步?
王小川:一个大的变化是从2D变成3D了,雅妮是2D形象的,动的时候也只是面对镜头的移动,到3D之后有不同的视角来拍你的人形,你可以旋转你的机位来看,手势有更大范围的表达。今天集大成发布的所谓主播,你把这样一种语音的一种能力,包括像翻译技术,更严格的表情管理,从翻译之后的文字的表征变成了数字化的手势表征,这里面是有非常多的不同技术的融合。
搜狐科技:搜狗下一步有没有探索新的技术,是怎样规划的呢?
王小川:我们认为在下一个阶段里面主播本身它的成熟到推广背后有特别多的工作要做,包括不断提升它的流畅度,使得大家能够得到更高的理解能力,行业60,我们到85。同时能够在更多场景应用,手语要需要规范的,官方有官方的手语以外,还有方言的手语,全球有全球的手语体系,如何能够实现,或者规范成标准的一个普通化一样的语言,这里面我们认为有更多的社会意义。
搜狐科技:数字人之外,整个人工智能领域来讲,搜狗有没有新落地的成果可以分享一下?
王小川:我们需要把各种能力做一个结合,之前提到的营养师,搜索里面大量问跟健康相关的问题,尤其不同的饮食,孕妇能不能吃西瓜等等的,我们要把这些一些知识跟用户的需求做到连接,同时经过数字人的载体给用户带来更好的互动。
我们提两个核心的理念,自然交互、知识计算,知识计算使得最大化的给用户的满足能够提高。
- 标签:初音一葱拍死了张根硕
- 编辑:刘卓
- 相关文章
-
远光 | 腾讯连投5轮、6年融资过百亿,每日优鲜冲刺“生鲜电商第一股”
尹莉娜 6月9日早间,每日优鲜递交招股书,正式冲刺美股IPO。 每日优鲜计划以“MF”(英文名MissFre…
-
刘庆峰发布科大讯飞22周年员工信:固守单一技术会被赶超,将推动系统性创新
6月10日消息,科大讯飞22周年,董事长刘庆峰发布给员工的一封信。他在信中提到,科大讯飞在年初提出…
- 远光|联合“优腾”对抗短视频, 能救爱奇艺吗?
- 远光 | 华为“朋友圈”又扩大了!三大银行宣布接入鸿蒙,体验到底如何?
- 小米遭虚假评价后索赔100万元,法院判决书出炉:被告侵犯小米名誉权
- 苹果开发者大会来了!iOS 15等系统迎来升级,与鸿蒙相比你更看好谁?
- 禾赛科技获高瓴、小米、美团等领投的3亿美元融资,此前科创板上市失败