【新智元导读】上周举行的Spark Summit 2016大会,吴恩达受邀发表演讲,再谈深度学习的两大推动力——计算力和数据。他认为,数据的获取和组织将成为大公司构筑行业壁垒的一个方式,“现在发布的一些产品目标不是收入,而是数据”。最后,吴恩达说,了解AI、分布式计算和HPC这3样东西,你将拥有颠覆行业的“超能力”。
深度学习如何训练语音识别模型
吴恩达首先介绍了Spark在百度的应用。
深度学习:神经元网络对模型的训练过程。
深度学习为什么获得飞跃式发展?
吴恩达的“火箭论”:大型的神经元网络为引擎,数据为燃料。
传统的语音识别模式:
数据(音频)—语音特征—现象—语言模型—转换结果。
Deep Speech 模式:端对端的学习
用神经元训练的语音识别模式。
深度学习对语音的训练过程。
语音数据(火箭的燃料)
语音识别表现(点击图片查看大图)
15年6月2日,错误率降至7%左右
15年7月5日,错误率降至6%
99%的准确率对于行业来说是颠覆性的。
百度的语音识别
2012年错误率17%,2013年错误率13%,2014年错误率8.5%,2015年错误率5.5%,2016年错误率3.5%。
从2015年一月份到2016年第一季度,用户量增加到3倍
吴恩达经历的计算能力进化
主要趋势1:神经网络大小和数据的多少对AI发展的影响。
计算能力的提升
吴恩达的个人经历:许多年前使用CPU进行深度学习训练;2008年在斯坦福实验室开始使用GPU,当时还有很大的争议;2011年在谷歌Brain使用Google Cloud,当时与Jeff Dean合作;2015年,在百度开始使用HPC。
现在训练一个模型:
GPU数量与计算能力的关系。
传统CPU架构。
GPU的优势:批量处理。
端对端的深度学习局限:标签数据
主要趋势2:
语音片段的转换(语音识别)
图像识别
图像识别过程
主要的局限在于:需要大量的标签数据。
正如电力的发明一样,AI也会对社会产生颠覆性的影响
正如电力一样,AI也会对社会产生颠覆性的影响。
吴恩达的调查:接下来五年内,哪一个行业受到AI的影响最大?
截止6月13日下午3点,共有308人参与投票。结果显示,医疗行业得票率最高,为36%,交通和制造业紧随其后,为24%和10%。详见上图。
投票地址:http://share.snacktools.com/F9C7BBEBDC9/q715o9n1
深度学习当下的应用与未来发展趋势
Dulight 项目,帮助盲人“看”世界。
深度学习在医疗中的应用。
自动驾驶。
其他领域:网页搜索、广告、消费金融、欺诈侦查、物流优化、预测数据中心硬件的失效、恶意软件监测、身份验证等等。
使用AI来协助人,推进商业发展。
未来趋势
吴恩达说:“现在发布的一些产品目标不是收入,而是数据。”
演讲的最后,吴恩达说:“未来,AI 将会为公司、消费者以及工程师创造巨大的价值。如果你了解AI、分布式计算和HPC,你将会改变整个行业,也会让人看到这种超能力。我希望我们都能有这种超能力。我会为人类尽自己最大的努力。”