首页
学习
活动
专区
工具
TVP
发布

昙花一现的唇语识别,不够高大上还是的确是鸡肋?

导语:很多技术初出场时给人以惊艳,然而,犹如昙花一现,惊艳也只是刹那。

在第四届世界互联网大会上,搜狗展台呈现了一项新技术——唇语识别。这项黑科技,动动嘴就可以让机器知道你要说什么。

当天在会场,很多人体验了搜狗的唇语识别。当你说出“这首歌叫什么名字”时,机器不用收音、进行语音识别,通过识别你的唇部动作,就能准确识别语义内容。现场有人体验完后表示简直是大开眼界、长了见识,“之前只知道语音识别、面部识别,没想到还有唇语识别技术这么神奇”。

其实搜狗这项技术,并不是首次出现。在央视财经频道《未来架构师》节目中,也曾惊艳亮相。当时是通过唇语识别进行拍照,引发现场主持人和观众的一致惊叹。

然而,每一次惊艳亮相,都并没有掀起波澜。即使是出于国内首个公开演示该技术、实际技术处于行业领先地位的搜狗,也没有给“唇语识别”带来更多的热点。

唇语识别技术展示现场

惊艳的亮相。不只是技术炫,实用性也很强!

在搜狗的宣传以及实际应用拉力看,这项神奇的黑科技可不只是技术炫,实用性也很强,比如说,在噪音太大或只有摄像头等无法捕捉声音的场合中,就能派上大用场。也就是说,相对于语音识别对语音环境的高要求,唇语识别可以实现“无语音环境条件”传播。

的确,唇语识别技术的发展,其实很大程度上就是为了解决在自然应用十分常见且不可避免的噪音现象。为了解决这个问题,一方面采用降噪技术降低干扰,另一方面开始寻求其它解决方法。唇语识别就是其中的一个方向。

也正因为如此,开发者们似乎探寻到了一个新的“商机”和可能性,毕竟唇语识别一旦发展够好,其应用范围不可小觑。别说对聋哑盲人会带来一定帮助,就是日常生后也可以有很大应用空间。

唇语识别的技术也已经得到研究

比如在日常语音输入中,类似马路、会议室、车载场景等噪音大的场景里,语音识别受限,那么,唇语识别可以帮助规避音频噪声对用户说话内容获取的影响,确保输入的准确率,保证交互的稳定性;

比如可以解决很多监控场景里没有音频的困扰。一般电梯、马路中只有摄像头,并没有麦克风,在各种证据方面都显得力量不够,然而如果加上通过唇语识别技术,则可以获取重要的用户讲话信息,为公共安全提供有效支持。

可见,从应用场景来看,唇语识别技术的市场潜力不容忽视,其实用性和技术难度丝毫不亚于语音识别、语义理解等技术,以搜狗为代表的科技企业竞相发力,研发布局,或许也正是看好其未来的市场应用前景。

尴尬的昙花一现。是技术不扎实?还是确实没必要?

可是,美好的一切也许只是设想,虽然唇语识别有着看起来光辉灿烂的前景,但实际效果却并不得力。到底是技术不过关,还是把市场前景想得太美妙呢?

其实,唇语识别的技术发展其实离不开人们对人类的语言识别系统的研究。语音识别的研究者们突然发现,其实人类的语言识别系统是由两个感知过程构成的,声音虽然是人类语言认知过程中最重要的方式,但在日常交流中,我们还会用眼睛看着对方的口型、对方的表情等,来更加准确的理解对方所讲的内容。

受此启发,研究者们开始研究唇语识别。也就是说,在技术上,唇语识别其实是完全可以达标的。

同时,市场前景也是值得可期的。因为唇语识别完全不会受到噪声干扰,在多人对话中也能有效进行区分,这就有望解决语音识别的缺陷。

唇语识别有一定的市场

也就是说,其实对于唇语识别的市场,各大研发者以及商家其实都心里有数:是为了辅助语音识别的。目前语音识别有一定条件束缚,施展空间没有那么大,但这个可以由唇语识别来补充。也就是说,将唇语识别与语音识别结合起来能够大大提高系统的正确率和抗干扰能力,于是唇语识别便有了更多的发挥空间。

目前在语音识别也还有发展空间的时候,唇语识别的发展可能还要再缓一缓。

10000亿市场大爆发,AI进入战国时代,6大关键词解读2018年中国人工智能发展大势

  • 发表于:
  • 原文链接http://kuaibao.qq.com/s/20180104C0SIEL00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

相关快讯

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券