知乎热议的Deep Peak2模型究竟是什么？答案都在这里

文章来源：企鹅号 - 期待的科技产生

作为人工智能中被广泛热议的语音识别技术，此前每每提起常与Siri、Cortana等划等号的境况如今已有改变。近几年，中国处在人工智能高速成长阶段，语音识别技术取得了一系列突破性的进展。国内各大科技巨头纷纷涉足语音识别领域，布局大量人力、物力等进行技术研发，比如百度前不久刚刚发布的语音技术新突破——Deep Peak2模型就引发了网友热议。

图式：社交网络中网友就语音识别技术展开讨论

在知乎问答帖《目前国内的语音识别技术是什么水准？》中，网友们就国内的语音识别技术展开讨论，有网友提到百度最新发布的技术突破——Deep Peak2模型，并介绍指出：“Deep Peak2模型全称是基于 LSTM 和 CTC 的上下文无关音素组合建模。”在此前传统的语音技术中，广泛使用“上下文相关建模”，指同一个音素，由于其左边或者右边相连的音素不同，被定义成不同的建模单元。百度此次推出的“上下文无关建模”是指一个音素，无论左右相连的音素是什么，都被定义成唯一的一个单元，这对于语音识别工业历史而言是巨大的技术进步。

在谈及该技术与此前“上下文相关建模”的差异点时，网友解释道：“因为把建模能力用在对建模单元的模拟上，而不是在上下文相关性上，所以上下文无关建模，其实可以更充分发挥神经网络模型的参数优势，因此精度更高。而且不需要利用决策树聚类模拟建模单元的上下文聚类，模型对多种说话方式的鲁棒性更强。”

作为人工智能中的重要领域，语音识别技术更新迭代发展迅猛。随着百度在手机输入法等各种产品中大力推广语音输入，百度在算法上的优势因此更加凸显。据悉，Deep Peak2目前已用于百度输入法这一拥有巨大用户量的产品之中，让每一位用户都有机会体验到最前沿的语音技术。

在国际巨头纷纷布局语音技术时，中国企业也毫不逊色。以BAT为首的科技巨头都在不断储蓄实力，提升产品的竞争力。期待未来以Deep Peak2模型为代表的语音技术能够应用于更多的设备和使用场景之中。伴随语音技术的飞速发展，未来还有无限的可能。

发表于: 2018-01-302018-01-30 17:21:47
原文链接：http://kuaibao.qq.com/s/20180130A0W18A00?refer=cp_1026
腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号（企鹅号）传播渠道之一，根据《腾讯内容开放平台服务协议》转载发布内容。
如有侵权，请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长进交流群

领取专属 10元无门槛券

私享最新 技术干货

知乎热议的Deep Peak2模型究竟是什么？答案都在这里

相关快讯

扫码

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐