您的位置首页  科技资讯  新闻

从语音产业拓荒者到人工智能国家队,科大讯飞是如何炼成的?| 创新100

编者按:《创新100》是搜狐科技在2020年推出的一档全新深度栏目,关注科技领域的创新,主要围绕人工智能、5G、大数据、芯片等技术创新,以及新零售、在线健身、云办公等商业模式创新。

《创新100》将通过可视化的数据榜单、深度视频访谈、系列选题策划等内容形式,同时,结合即将举办的线下大型活动,聚焦最有科技力、创新力的百家公司。

【创新评析】

成立二十多年,科大讯飞从中国语音产业拓荒者,最终成为行业领军者,也是首批人工智能国家队,位居中国智能语音行业老大的地位。2019年科大讯飞营收首次突破百亿,同时实现人工智能战略从1.0到 2.0阶段的跨越,开启了新的商业化征程。

技术方面,科大讯飞坚持“顶天”策略,深耕语音领域,构建拥有自主知识产权的技术体系。目前,科大讯飞以感知智能+认知智能为两大研究方向,在语音合成、语音识别、语音评测、图文识别、机器翻译等多项核心技术方面走在前列,在国际赛事中获得近30项冠军。

商业模式方面,科大讯飞确立“立地”策略,坚持聚焦刚需赛道,基本形成2B+2C双轮驱动的模式,成为业内少有的同时布局两端业务的AI企业。物联网给AI带来更大的想象力,而科大讯飞也在积极搭建生态,力图在未来的市场中获得更强的核心竞争力。

编辑|

提到1999年,人们想到最多的是如今统治中国互联网江湖的BAT,他们都在这一年成立,阿里十八罗汉的创业故事更是为后人津津乐道。但这一年,还有一家远离互联网中心的公司落地——合肥的硅谷天音,也就是科大讯飞的前身,一家脱胎于中科大实验室的创业团队,同样是十八个人的班底,带头的是当时尚在中科大深造的刘庆峰。

他们选择的创业方向是当时看起来并不热门且国内市场基本被国际IT巨头垄断的语音领域。科大讯飞扛起自主研发的大旗,一家从民房里走出来的“草台班子”最终成长为人工智能国家队。

同时,科大讯飞也完成从技术到商业、从实验室到市场的蜕变,蹚出了一条2B+2C两条腿走路的商业化路径。对于当下的AI行业来说,科大讯飞无疑提供了一个技术商业化路径的样本。

“一路走来,我们都是用技术顶天产业立地的方式来带动整个行业的发展,很多人在模仿我们,但我们从来没有被超越。” 在本月初的新品发布会上,科大讯飞轮值总裁胡郁说到。

不过,相较于当下人们对AI的追捧和想象,20多年前人工智能才刚刚从低谷中走出。1997年,IBM的计算机系统“深蓝”战胜国际象棋世界冠军卡斯帕罗夫,再次引发行业关注。科大讯飞由此踏上人工智能的第三波浪潮,并实现了人工智能战略的跨越。

但在被美国列入“实体清单”、国内外互联网科技巨头又纷纷布局AI赛道的竞争情况下,科大讯飞又该如何继续实现“用人工智能建设美好世界”的使命?

实验室走出的团队

科大讯飞的创业经历,是个典型的中国技术创业故事。2000年前,中文语音几乎为国外公司垄断,微软、IBM等国际知名企业纷纷在国内建立中文研究院。

彼时中国的语音技术研究多还停留在实验室阶段,科大讯飞的成立就离不开中科大电子工程系的“人机语音通信实验室”。当时该实验室的导师是中国语音界泰斗级教授王仁华,刘庆峰本科时就加入这个实验室搞研究。

1998年刘庆峰牵头的中科大团队在国家863计划支持的语音合成技术项目上夺冠,其在该项目的评测被专家组认定为初步达到实用化水平。这让刘庆峰产生了将研究成果产业化的想法,为此他还拒绝了微软奖学金。

于是,刚从中科大研究生毕业的刘庆峰加入了创业浪潮,还拉上中科大实验室的同门师兄弟,搭建起18人的班底,在租来的民居里于1999年4月成立硅谷天音,年底则更名为科大讯飞,后来其还获得联想和复星的投资。

语音是典型的交叉科学,涉及到声学、语言学、计算机工程处理等多领域,和人工智能一样,属于技术先导型产业。如何在被巨头垄断的市场中抢得发展机遇?科大讯飞的做法是通过自主创新实现技术突破,构建源头技术壁垒。

“只有依靠创新实现核心技术领先,才有可能在激烈的竞争中立足、生存、发展。”刘庆峰曾在接受媒体采访时表示,创新就是科大讯飞的生命线。在All in语音技术,坐了多年冷板凳后,科大讯飞从中国语音产业的拓荒者最终成为领军者。

2014年科大讯飞又启动针对高级人工智能的“讯飞超脑”计划,并形成以感知智能+认知智能两大研发方向,在语音合成、语音识别、语音评测、图文识别、医学影像、机器翻译、自然语言理解等多个自主研发的核心技术方面,实现了对人类水平的多次超越。

据科大讯飞轮值总裁胡郁介绍,科大讯飞在国际赛事上共获得28项世界冠军,并连续两年入选《MIT科技评论》 “全球最聪明50家公司”榜单,公司语音转写识别正确率达到98%。2017年科大讯飞还作为智能语音领域代表和百度、阿里云、腾讯成为首批国家新一代人工智能开放创新平台,并主持和参与制定多项国家/国际标准。

这离不开对研发的重视。近年来,科大讯飞的技术团队规模稳定占比在60%以上,研发投入占营收比也保持在20%以上,公司也牢牢占据国内智能语音市场老大的地位。数据显示,科大讯飞在中文语音市场占有率达44.2%,比百度、苹果等后四位市场份额之和还要略高,同时在多个重要细分领域市占率超过60%。

“我们一直坚持做源头核心技术的自主创新,去年10月8号也被列入实体清单。”胡郁在月初的新品发布会上称。据了解,在被列入“实体清单”后,科大讯飞迅速切换到以国产供应链为主的非美供应链体系,加之拥有自主知识产权的核心技术,公司业务运营未受到重大影响。

不过,伴随着人工智能技术门槛的降低,核心技术领先的窗口期也在逐步缩短,这是所有企业都需克服的问题。科大讯飞副总裁李传刚在接受搜狐科技采访时认为,既要坚持源头核心技术创新,又要保持对外部技术的敏锐嗅觉,设定合理的技术台阶,保持多个不同技术方向间的充分沟通和信息流的传播,尽可能实现某项技术进步带来的“放大器效应”,这些都可以增强壁垒。

科大讯飞也在做这样的尝试。李传刚表示,在现有技术基础上,科大讯飞还会充分利用语音、图像等多模态信息的互补作用,结合场景需求研究多类技术的方式,提升实际场景下识别等感知能力的可用性,拓宽技术的应用领域。

2B+2C两条腿走路

随着2016年AlphaGo战胜世界围棋冠军李世石,人工智能第三波浪潮迎来高潮。然而潮水过后,如何实现规模化应用成为AI行业面临的普遍问题。

这是技术先导性企业打通最后一公里最为关键的问题,而这也曾是困扰科大讯飞的问题。创立初期,科大讯飞定位于大众消费市场,并在2000年推出一款针对PC的智能语音软件“畅言2000”。但由于当时盗版猖獗,PC普及率较低,C端用户教育和售后服务成本高,科大讯飞这一尝试失败。

科大讯飞迅速调整,幸运的是,其语音合成系统引起了华为的注意,并最终拿下华为订单,中兴、联想等后来也成为其客户。科大讯飞由此发展出最初成型的商业模式——“iFLY-inside”,即2B模式的一种,基于核心技术,向开发商提供语音支持软件服务。

然而,科大讯飞很快发现,这种模式存在利润空间低,且无法直接触达终端用户,难以对系统进行升级优化等短板。科大讯飞再次探索,最终选择直接面向行业终端,提供语音技术应用解决方案,并成为公司核心发展模式。随着2B领域做大做强,科大讯飞在2008年实现上市,随后其又开始踏足2C市场。

目前,科大讯飞基本形成2B+2C双轮驱动、软硬件齐头并进的业务模式,去年公司营收首次突破百亿,其中2B业务贡献64%收入,其集中在教育、医疗、政法、汽车、智慧城市、智能客服等领域。

2C方面,科大讯飞在2010年先后推出讯飞输入法、讯飞语记、讯飞听见等软件,在2016年整合消费者事业群后,又发布了音箱、录音笔、翻译机、办公本等多款智能硬件产品。这个月初,科大讯飞还发布了三款智能录音笔,并推出了首款智能TWS耳机iFLYBUDS,进一步丰富了办公市场需求。

系列产品的发布推动了2C业务的快速增长。从2017年到2019年,科大讯飞消费者业务从6亿收入、3亿毛利增长到30多亿收入、15亿毛利,胡郁预计今年还会持续增长。去年2C业务占比已接近36%,今年上半年提升至38%,基本完成科大讯飞三年前提出的占比四成的目标。

从2C到2B,再到2B和2C双轮驱动,科大讯飞在跌跌撞撞中闯出了一条“弯曲的直线”,其也成为业内少有的同时布局两端的AI企业,其他AI企业多数聚焦于2B赛道。

李传刚认为,多数AI企业首先落地B端,主要是因为市场,技术应用早期价格比较昂贵,个人消费者缺乏消费习惯。而科大讯飞能够实现两端布局,得益于自身的一套逻辑。在AI落地时,必须有具体实战案例,能解决用户刚需;案例可以规模化推广,产生规模化效益;应用AI以后,能有统计数据证明具体成效。

基于这样的标准,科大讯飞人工智能战略也实现升级,其在2019年宣布公司从“人工智能1.0阶段”进入“2.0阶段”。“在1.0时代,注重的是核心技术的突破,如突破语音识别、语言处理和翻译技术;2.0时代强调应用落地,以及思考在智能物联网时代如何去构建新的商业生态。”李传刚解释称。

至于到底要做一家2B还是2C的公司,对科大讯飞来说已不重要。“人工智能未来会立足于应用场景驱动而不断落地,实实在在解决刚需。长远来看,无论是2B还是2C,我们希望做一家能够解决用户刚需的公司。” 李传刚表示。

物联网时代的新竞争

作为智能语音与人工智能领域的代表性企业,科大讯飞也必然面临来自国内外巨头的挑战。如何应对行业竞争?

除了构建技术壁垒,更为重要的是搭建生态,这也越发成为业内共识。科大讯飞也认识到,人工智能的竞争不是单个企业的竞争,而是一个产业链对一个产业链的竞争、一个体系对一个体系的竞争,是生态的竞争。

因此在应用赛道之外,科大讯飞确定了平台战略。2010年科大讯飞首家上线人工智能开放平台,通过技术赋能、市场赋能和投资赋能,持续为移动互联网、创业开发者和用户提供人工智能开发与服务能力,围绕人工智能开放平台构建产业生态。

胡郁认为,智能语音和人工智能不仅仅是科大讯飞强大的技术支撑,最重要的是还要面向整个行业。“有大量各种各样的应用需要人工智能技术,但并不是每家公司、每个开发团队都需要把人工智能技术自己做出来。”他如此解释科大讯飞开放平台的原因。

目前,讯飞开放平台已对外开放超过300项 AI 能力及方案,连接超200万生态合作伙伴,开发者团队数量从2017年的53万个已增长至今年8月底的 142万个,连接终端从17亿台增长到今年的29亿台,形成了从源头技术创新到产业技术创新的全生态创新体系。

同时,随着物联网时代到来,人机交互的价值也日趋重要,而语音将成为重要入口。科大讯飞2015年发布新一代人机智能交互开放平台发布AIUI,目前已进阶至3.0版本,并不断完善技能开发工具和平台能力,与行业共享共建。

未来的智能不仅只是实现人机交互,还是设备间的互通互联。胡郁认为,智能硬件的发展将对整个语音交互会带来非常高的使用需求,但做硬件需做好长期投入准备。科大讯飞除了坚持硬件策略,也推出智能物联云AIoT,通过传感器和终端设备连接用户和开发者,建立完整的物联网智能消费场景,助力人工智能向应用智能发展。

“未来不管是我们和人工智能,还是和机器人之间,都应该是自然的交互。如智能汽车、智能家居等,都能和你进行对话和交流,并能够理解你所讲的话,从而提供服务。”这是胡郁畅想的语音交互的未来。不过他认为,目前语音交互还没有成为主流,大概还要5-10年。

这将为科大讯飞抢占物联网新机遇创造时间窗口。在致力于推动机器能听会说,能理解会思考,用人工智能建设美好世界的使命之旅上,科大讯飞已行至中途,未来还将有更多可能,同时也将面临更大竞争与更多挑战。

免责声明:本站所有信息均搜集自互联网,并不代表本站观点,本站不对其真实合法性负责。如有信息侵犯了您的权益,请告知,本站将立刻处理。联系QQ:1640731186