专栏首页罗超频道科大讯飞,站在十字路口

科大讯飞,站在十字路口

在位于合肥规划中三到四平方公里的中国语音产业园,建筑机械群正在紧张作业。在竣工的讯飞大厦里,两千多名科大讯飞员工围绕“声音”忙碌着。在移动互联网的风口,兼具软件和互联网公司特征的讯飞,站在了2B和2C市场的十字路口,前途看上去机会重重但又充满凶险。

近期,受科大讯飞邀请,笔者与一些媒体人前往合肥,对讯飞的技术、处境,以及讯飞怎么看待语音市场的竞争态势与格局,做了采访与了解。

一、移动语音市场要爆发了!是真的吗?

今年是中国语音市场最热闹的一年。创业新秀云知声刚获得1500万美元投资,互联网巨头百度、腾讯微信纷纷将语音识别能力开放出来。新的科技消费品均将语音交互功能作为标配,在可穿戴设备等硬件创业大潮下,语音市场焕发着勃勃生机。一位语音创业公司副总表示,语音市场即将爆发。

面向语音的研究可以追溯到上个世界五十年代,1952年贝尔研究所Davis等人研究成功了世界上第一个能识别10个英文数字发音的实验系统。在此后的几十年间进展缓慢,技术水平、计算能力和应用场景,都不成熟。由于场景的局限性,语音技术在PC互联网时代并未大幅普及。主要应用在一些垂直领域例如呼叫中心、教育、电信和金融等行业。

伴随着iPhone 4S推出的Siri则让人们看到语音大规模普及的前景。这时,Siri语音技术支持方Nuance、国内语音巨头科大讯飞等语音巨头从企业市场的幕后走向面向终端用户的前台,语音创业者大量出现。

移动设备“能听会说”的特性给语音爆发带来了交互的基础。不过,语音交互天生存在缺陷:容易干扰他人,也容易受周边环境影响,而且人机对话从“识别”到“理解”仍然有距离。因此,语音技术能多大程度普及,是个问题。

就算普及开来,2C的语音主流产品主要包括语音助手、语音输入法、声纹鉴权、语音合成、智能客服,以及一些硬件接入的语音交互功能。这些工具相比社交沟通、搜索、工具娱乐、游戏等高频应用来说,使用频率会低很多。且目前没有一种成型的商业模式。语音服务商要么是靠2B定制赚钱,要么是将语音作为一种支撑手段而不是营收业务。

占据中国语音70%以上市场的科大讯飞,2012年收入7.8亿元。而BAT等互联网巨头全年收入则是数百亿。语音市场大盘依然很小。

二、科大讯飞眼中有两类竞争对手。

照科大讯飞董事长刘庆峰的话说,未来中国的移动语音应用可能会三分天下,一份是外企,一份是国内的互联网,一份是科大讯飞。

跨国公司方面,首屈一指的巨头是Nuance。Nuance比科大讯飞成立还早七年,这家语音先驱占据全球2/3的市场,为Siri、三星S-Voice以及一些呼叫中心提供服务,“Nuance Inside”的模式与讯飞“iFly inside”相仿。Nuance早已盯上中国这个新兴市场,2009年在上海建立了语音技术开发中心,在讯飞推出语音云之后也针对中国市场推出移动开发者项目。

现在Nuance在车载语音系统等市场挑战讯飞,与克莱斯勒、奔驰、宝马等车商合作,一方面与苹果、三星等国际科技厂商合作通过预置应用入侵中国市场。

国外的重量级玩家还有Google,04年涉足语音领域,09年推出语音搜索,去年推出的Google Now成为与Siri不相上下的语音助手。由于众所周知的原因,Google使用暂时不会这么方便。

另外一股力量则是来自互联网阵营。

百度在去年7月成立语音团队,年底推出语音助手,10月25日上线了语音开放平台,速度不可谓不快。腾讯微信因为天生的语音属性和产品支撑的需求,也成立了三十多人的语音团队,在春节前的4.5版中以公众账号推出“语音提醒”功能小试牛刀,10月份开放了语音识别接口,接下来还将会开放给其他App。

另外,还有一拨互联网玩家,搜狗语音助手、虫洞、智能360等产品则基于第三方语音技术做上层服务。这些技术可能是讯飞的,也可能是竞争对手的。因为缺乏自主的核心技术,这类网站对于讯飞而言威胁不大。

百度的优势在于搜索技术和机器学习能力,海量用户产生的数据和反馈帮助提升产品体验,使得语音识别率等关键技术进步迅猛,加上互联网土豪在产品、推广以及渠道上固有的优势,这些都对讯飞构成了巨大挑战。互联网巨头发展语音技术,还有生态优势和产品线资源,比如百度可以通过语音技术输出地图、音乐、百科、知道乃至轻应用,提供给合作方并最终向用户提供全方位服务。语音的竞争正在从技术层面转到生态层面。

三、科大讯飞是怎么活下来的?“iFly inside”模式巩固B端市场地位

作为中国语音市场的唯一上市公司,科大讯飞占据语音市场份额已超过70%。

语音市场早期玩家不只有科大讯飞,而研究机构除了中科大,北方还有清华、中科院、北京交通大学等院校。最后科大讯飞能熬到上市并接近市场寡头的地位,这与其专注于语音技术,“iFly inside”商业模式,以及产研结合驱动有关。

从现场演示来看,讯飞在语音合成、语音识别以及语音评测上的效果以及工业化的程度确实已经到了相当惊艳的程度。对维吾尔族等少数名族语言、四川话广东话等方言的支持,更是做到业界独一无二。在车载系统的现场演示中,尽管车内外噪声环境复杂多变,但车载语音系统仍然可以100%精准识别司机的命令。笔者日前针对讯飞语音输入法和另外一款语音输入法做对比测试,前者识别率完胜。

在讯飞专注语音时,反观其竞争对手,有的进入图像识别,有的开始做手机游戏,多线作战。

讯飞除了自有的研究队伍外,依托中科大同时又与国内主流的语音研究机构例如清华、社科院语言所、中科院自动化所合作,与新疆、内蒙古等少数民族大学合作建立了实验室。研究成果工业化,工业化的经济收益又支持理论研究,这种“双螺旋”模式是科大讯飞语音技术牛的基础。

在传统B端定制市场的增长点来自几个重点行业。

1、教育为本:讯飞已经把超过三分之一的人力投入在线教育,开始形成“考试落地->学校推广->获取学生用户”三步走战略,预计教育领域的业绩增长率至少保持在50%。讯飞在教育上的主要产品则是口语评测、多媒体教学系统以及教育门户。在儿童成长方面则有儿童玩乐App、儿童玩具等产品。

除了教育,科大讯飞B2B业务的重点,也是现在移动互联网的热点:

2、智能手机:从内置语音功能到App的语音服务,绝大部分使用讯飞的技术。

3、智能电视:智能电视很重要的方向就是人机交互更加灵活智能自然,海信、康佳、海尔、TCL、长虹,国内主流厂商使用讯飞技术。

4、智能家电:家庭是非常适合语音交互的场合。讯飞与主流家电厂商均建立了合作。

5、汽车行业:奔驰、宝马、奥迪等已引入或者即将引入讯飞的语音技术。高德地图等导航大头也与讯飞建立了战略同盟。讯飞语音技术可以做到“0流量”的离线识别,抗噪效果也较为领先。

6、呼叫中心:运营商、金融、民航,电商等行业的呼叫中心。讯飞在创业早期便与电信等运营商建立合作,后来又引入中移动投资,在运营商呼叫中心探索上有资源优势,前不久便拿下了安徽移动数千万的呼叫中心服务大单。

四、艰难转型:iFly Inside 到Outside,2B到2C,软件思维到互联网思维

科大讯飞当前所依赖的市场仍旧有“将鸡蛋放在一个篮子”或者说“少数几个篮子”的隐忧。

以汽车市场为例,除了Nuance的强势外,百度也与福特达成战略合作,在语音助手、百度地图等产品的基础上进行车内空间的探索。汽车之外,专业语音玩家和互联网巨头对其他行业客户的争夺同样只会日趋激烈。

技术并不能成为一个持续生效的护城河。长远看,科技行业某领域的技术差距会随着技术扩散被缩小甚至填平。在此之前,挑战者通过价格战甚至免费的方式获得一些价格敏感型客户。

讯飞高度依赖的教育语音市场的增长能持续几年也是个问题。传统教育本身也在面临着互联网的冲击,未来充满变数。科大讯飞有一些互联网教育衍伸产品,且计划打造中国最大教育门户,但其教育语音软件(评测考试、课堂辅助软件、儿童教育应用)与互联网如何结合上,不够清晰。

科大讯飞的软件收入模式也存在“一竿子买卖”的弊端。与互联网的持续服务不同,软件交付之后,买家可以脱离厂商。就算不脱离则会进入按人头付费或者按运维周期付费的运维阶段,有点外包项目的性质。外包意味着利润率将降低,技术、资源等门槛会消失。

因此,综合来看,讯飞要想掌握更长远的未来,仍旧需要继续他的转型道路,从2B到2C,从inside到outside,从软件交付转到互联网服务。哪怕移动互联网的语音应用不赚钱,哪怕讯飞只能三分天下,转过去都是讯飞必须要走的道路。

讯飞几年前开始启动移动互联网战略:

√ 通过语音云、语义云等开放平台将自己的能力开放出来,拉拢开发者到语音生态体系。

√ 面向个人的讯飞输入法在语音输入、手写输入上体验已经很顺畅,用户数突破1亿。

√ 与中移动合作推出灵犀语音助手,科大讯飞在产品和技术上负全责,中移动在运作、推广上即有资源也有能力。

√ 科大讯飞还有即将全面推出的爱吼网——一个在线K歌社区。

从实际情况来看,这是一个艰难的过程。这些产品从用户量、活跃度和知名度上看依然没达到移动互联网的“船票标准”。

互联网化仍然不足。正如刘庆锋所言:

从讯飞的移动互联网的战略中,我们也在不断的反思,我们跟那些小的互联网厂商比,或者跟更大的互联网厂商比,都显得我们的效益比他们高,真的不是我们做事速度没他们快,而是没他们那么会宣传,没他们会运作,当然在这个产品的迭代和推动中我们也还有很多要改善的地方。

身处合肥的科大讯飞能在语音领域建立自己现在的地位,着实不易。要想维持自己在传统语音市场的霸主地位,同时实现“三分天下移动语音市场并且做最大”的目标,科大讯飞这个语音巨人在软件和互联网、2B和2C、inside和outside的十字路口,必须选准一个方向,狠狠地走下去,国外语音技术老牌巨头、百度等互联网巨头是横亘在前面的高坡。

本文分享自微信公众号 - 罗超频道(luochaotmt)

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2013-12-01

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 超过十分之一的报告篇幅给语音,互联网女皇为何看好麦克风?

    KPCB合伙人、享有“互联网女皇”称号的玛丽·米克尔的互联网趋势报告于今天正式发布。毫不夸张地说,这份报告是互联网行业分析的“超级碗”,它用200多页的Keyn...

    罗超频道
  • 语音巨头时代来临!谁将是中国Siri?

    大约一年前,中国移动以13.6亿人民币的代价获得了科大讯飞15%的股权,后者股价一路攀升,从不足30元到最高61元,成为一大牛股,市值高达240多亿人民...

    罗超频道
  • 从近讲到远场,小米自研语音技术让用户“自由场景自由说”

    小米语音团队的“多通道端到端语音技术”自研能力,取得比“传统多通道阵列增强模块加单通道语音技术”更好的性能。

    罗超频道
  • 语音直播平台源码打造不同服务场景常用技术解决方案

    以声音这种更方便、亲近的交流方式能传递的信息比文字更多,语音、语气、语调甚至停顿长短都能反应一个人的情绪变化,不少年轻用户看来,声音可以让自己更贴切地感知到对方...

    布谷安妮
  • 神一样的文字转语音软件,不仅免费功能还强大

    之前给大家推荐过小程序分享丨智能文字转语音神器,讯飞快读这个小程序可以解决大家文字转语音的问题,小轻论坛也绑定了讯飞快读,大家可以在公众号的菜单栏打开这个小程序...

    半夜喝可乐
  • 语音控制:企业计算的下一个重大突破

    如果说2007年 iPhone 的发布开启了近十年来消费者信息传达被屏幕和视觉统治的时代,那么,语音将成为继智能手机之后企业科技界下一个最大的颠覆。

    人称T客
  • AI语音交互领域常用的4个术语

    语音合成标记语言的英文全称是Speech Synthesis Markup Language,这是一种基于XML的标记语言,可让开发人员指定如何使用文本转语音...

    曼孚科技
  • 干货 | 极限元算法专家:深度学习在语音生成问题上的典型应用 | 分享总结

    AI 科技评论按:深度学习在2006年崭露头角后,近几年取得了快速发展,在学术界和工业界均呈现出指数级增长的趋势;伴随着这项技术的不断成熟,深度学习在智能语音领...

    AI科技评论
  • 语音巨头时代来临!谁将是中国Siri?

    大约一年前,中国移动以13.6亿人民币的代价获得了科大讯飞15%的股权,后者股价一路攀升,从不足30元到最高61元,成为一大牛股,市值高达240多亿人民...

    罗超频道
  • 超过十分之一的报告篇幅给语音,互联网女皇为何看好麦克风?

    KPCB合伙人、享有“互联网女皇”称号的玛丽·米克尔的互联网趋势报告于今天正式发布。毫不夸张地说,这份报告是互联网行业分析的“超级碗”,它用200多页的Keyn...

    罗超频道

扫码关注云+社区

领取腾讯云代金券