我一直在想,为什么在为人工智能机器学习收集语音数据时,为语音数据收集前后的沉默是很重要的呢?这仅仅是为了让机器学习和理解“沉默”、“背景噪声”和实际“语音”之间的区别吗?
发布于 2019-04-12 21:18:55
当将原始数据分割成适当大小的样本用于机器学习方法时,沉默通常是有用的。一次运行几分钟的录音是可行的,但是机器学习模型的输入通常应该是1秒剪辑。每个剪辑都应避免中途切割一个单词。拥有沉默允许使用简单的阈值算法分割单词或短语。
https://datascience.stackexchange.com/questions/46501
复制相似问题