现在技术越来越厉害了,前几年还感觉语音打字特别不靠谱,各种语音助手也相当蠢萌,想问下现在国内语音识别发展到什么水平了?

实时且准确的将语音转化成相对应的文本已经达到了什么样的水准?主要还存在哪些方面的问题?

小南同学小南同学提问于
okchina软件工程硕士 Java攻城狮回答于

在实际生活中并没有说的误差率仅有3%那么牛逼吧。

比如嘈杂环境或带口音的方言都很大程度影响着语音识别的准确度。

更不用说中文这么复杂,同一个发音的词会很多不同的意义,提高语音识别的精度还是有很大难度的。

按照目前的技术水平来看,随着麦克风阵列等硬件技术的升级,语音数据的收集,语音识别的准确流程还能提升,但也只能无限接近于100%,但绝不可能做到完全准确

回答过的其他问题

如何在腾讯云上运用python?

okchina软件工程硕士 Java攻城狮
python是一门优秀的综合语言,python的宗旨是简明,优雅,强大,在人工智能,云计算,金融分析,大数据开发,web开发,自动化运维,测试等方向应用广泛,已是全球第4大最流行的语言 目前python主要应用领域:   web开发--最火的python web框架Django...... 展开详请

网页直播技术是如何实现的?以及如何实现简单的聊天室功能?

okchina软件工程硕士 Java攻城狮

不推荐自己建设,一方面投入成本太大;另一方面如若没有纯熟的技术团队,开发周期、运维等也会让人头疼的事情。

如何在python中循环遍历不同的变量

okchina软件工程硕士 Java攻城狮
好吧,所以这是迄今为止最糟糕的做法,但这首先出现在我脑海中: n = 1 models = [] while n <= 5: #or whatever number your modelx thing goes up to models.append(eval('mod...... 展开详请

实时音视频TRTC如何观看屏幕分享?

okchina软件工程硕士 Java攻城狮
blocks|key|21nsc|type|unstyled|text|您好,实时音视频TRTC观看桌面分享目前需要通过订阅进行查看的,更多详情可参考:|depth|inlineStyleRanges|entityRanges|6kfrp|观看+Mac+/+Windows+屏幕分...... 展开详请

实时音视频 TRTC 能够监听小程序缩小到后台

okchina软件工程硕士 Java攻城狮
blocks|key|ou5p|type|unstyled|text|可以。监听小程序的onHide方法,进行查看用户是否缩小到后台。|depth|inlineStyleRanges|entityRanges|entityMap|data|mutability^0^^$0|@$1...... 展开详请

云服务器购买咨询

okchina软件工程硕士 Java攻城狮
您好,按量计费是云服务器实例的弹性计费模式,您可以随时开通/销毁主机,按主机的实际使用量付费。计费时间粒度精确到秒,不需要提前支付费用,每小时整点进行一次结算。适用于电商抢购等设备需求量瞬间大幅波动的场景,单价比包年包月高3-4倍。开通按量计费云服务器实例时,会预先冻结该 CVM...... 展开详请

关于作者

所属标签

扫码关注云+社区

领取腾讯云代金券