前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >语音识别技术受追捧,无法独立工作的“速记神器”何时才能成为新亮点?

语音识别技术受追捧,无法独立工作的“速记神器”何时才能成为新亮点?

作者头像
镁客网
发布2018-05-30 11:17:57
6210
发布2018-05-30 11:17:57
举报
文章被收录于专栏:镁客网

从当前来看,速记神器确实为特定人群所需。

近日,搜狗召开发布会,正式推出其自研的速记神器——搜狗听写。这是一款能够将语音实时转变成文字的速记工具,拥有转写和听写两种模式,主要面向记者、编辑、作家等文字工作者。

由搜索而知名的搜狗

在人工智能领域似乎也玩的风生水起

众所周知,搜狗以搜索业务起家。除搜索业务外,其在近年还因搜狗输入法、搜狗高速浏览器等在行业内颇具名气。

如果仅从以上这些来看,搜狗此次推出“搜狗听写”似乎显得有些无厘头。然而,搜狗CEO王小川曾表示,搜索本身也是一种AI。

回顾搜狗的发展史,除去初期产品,搜狗在其产品迭代或新品中都或多或少的运用到了人工智能技术,例如搜狗云输入法、加入了云计算技术的搜狗输入法5.0版本、儿童智能手表“糖猫”等。

很显然,这一次搜狗将目光瞄准了语音识别领域,也似乎做出了点成绩。搜狗语音交互技术中心总经理王砚峰表示,搜狗听写中涉及到了大量前沿技术,例如大规模的优质语音数据训练和深度学习的技术能力积累等,不仅可应用于多个场景,其语音识别准确率也高达97%以上。

产品并无明显差异化竞争优势

搜狗听写要拿什么去竞争?

从搜狗方面的介绍看,搜狗听写可提供两种服务,语音转写和语音听写。此外,它还同时具备了边听边改、无线标重点、多端同步、信息分享等多个功能。而这样的语音转写工具,似乎在行业内并没有什么明显的差异化竞争优势。

除新鲜出炉的搜狗听写之外,科大讯飞的云犀、思必驰的语音输入板等,都是能够将语音转换成文字的工具。此外,仅在中国,除去普通话,大方言就有八种,各小地区方言更是多不胜数。这其中所涉及到的语音识别、语义识别、深度学习、算法训练等多个人工智能尖端技术,难度不可谓不大。

很显然,与一直致力于语音识别领域技术开发的企业相比,搜狗在专业程度及行业经验方面都有不做。而除去这些专业性企业和产品之外,当下很多输入法及搜索工具也有类似的功能,搜狗并没有赋予搜狗听写具有差异化竞争力的功能。在市场逐渐开拓的当下,搜狗想要凭借搜狗听写搏得一方市场,显然不容易。

技术+人工

AI至今未能真正做到全智能

在语音转化文字方面,除去偏C端的工具外,专业性系统或软件也有很多,例如科大讯飞的听见智能会议系统。在大多数的专业性会议,主办方都会聘请的专业速记人员。而与前几年相比,现今的速记工作已经有了更多人工智能的参与。

只是这其中存在着一个的现象,当前的语音转写技术并不能一力承担整场专业性会议,还需要有专业速记员全程盯着,实时进行纠错没有识别出的内容、标点等。

科大讯飞负责会议现场速记的一位专业速记员表示,在以科大讯飞听见智能会议系统为主导、没有纯正方言的情况下,正常会议速记工作的人工参与率是5%—10%。

不过,在人工智能相关技术不够成熟的当下,这样的人工参与率已经是很低的了。虽然目前我们并不能做到完全智能,但仅就速记AI领域来说,有了专业速记员的配合,不仅能够保证速记内容的精准,还能为开发者提供更为直观的现场反馈,为技术的进一步发展助力。

总结

随着人工智能相关技术的发展与前景的逐渐明朗,似乎所有行业都想在这一领域插上一脚,大公司更是不例外。当然,企业发展需要新鲜元素的加入,但如果只是为了与“AI”沾亲带故以获得“宣传”的理由,对于行业来说,这样的企业或从业者也许就是毒瘤。

从当前来看,速记神器确实为特定人群所需,但想要让这类产品成为刚需,还需行业者切实考虑用户需求,尽快让AI成为真正的全智能技术。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2017-08-09,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 镁客网 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 由搜索而知名的搜狗
  • 在人工智能领域似乎也玩的风生水起
  • 产品并无明显差异化竞争优势
  • 搜狗听写要拿什么去竞争?
  • 技术+人工
  • AI至今未能真正做到全智能
  • 总结
相关产品与服务
语音识别
腾讯云语音识别(Automatic Speech Recognition,ASR)是将语音转化成文字的PaaS产品,为企业提供精准而极具性价比的识别服务。被微信、王者荣耀、腾讯视频等大量业务使用,适用于录音质检、会议实时转写、语音输入法等多个场景。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档