知乎热议的Deep Peak2模型究竟是什么?答案都在这里

作为人工智能中被广泛热议的语音识别技术,此前每每提起常与Siri、Cortana等划等号的境况如今已有改变。近几年,中国处在人工智能高速成长阶段,语音识别技术取得了一系列突破性的进展。国内各大科技巨头纷纷涉足语音识别领域,布局大量人力、物力等进行技术研发,比如百度前不久刚刚发布的语音技术新突破——Deep Peak2模型就引发了网友热议。

图式:社交网络中网友就语音识别技术展开讨论

在知乎问答帖《目前国内的语音识别技术是什么水准?》中,网友们就国内的语音识别技术展开讨论,有网友提到百度最新发布的技术突破——Deep Peak2模型,并介绍指出:“Deep Peak2模型全称是基于 LSTM 和 CTC 的上下文无关音素组合建模。”在此前传统的语音技术中,广泛使用“上下文相关建模”,指同一个音素,由于其左边或者右边相连的音素不同,被定义成不同的建模单元。百度此次推出的“上下文无关建模”是指一个音素,无论左右相连的音素是什么,都被定义成唯一的一个单元,这对于语音识别工业历史而言是巨大的技术进步。

在谈及该技术与此前“上下文相关建模”的差异点时,网友解释道:“因为把建模能力用在对建模单元的模拟上,而不是在上下文相关性上,所以上下文无关建模,其实可以更充分发挥神经网络模型的参数优势,因此精度更高。而且不需要利用决策树聚类模拟建模单元的上下文聚类,模型对多种说话方式的鲁棒性更强。”

作为人工智能中的重要领域,语音识别技术更新迭代发展迅猛。随着百度在手机输入法等各种产品中大力推广语音输入,百度在算法上的优势因此更加凸显。据悉,Deep Peak2目前已用于百度输入法这一拥有巨大用户量的产品之中,让每一位用户都有机会体验到最前沿的语音技术。

在国际巨头纷纷布局语音技术时,中国企业也毫不逊色。以BAT为首的科技巨头都在不断储蓄实力,提升产品的竞争力。期待未来以Deep Peak2模型为代表的语音技术能够应用于更多的设备和使用场景之中。伴随语音技术的飞速发展,未来还有无限的可能。

  • 发表于:
  • 原文链接:http://kuaibao.qq.com/s/20180130A0W18A00?refer=cp_1026

相关快讯

扫码关注云+社区