Charlie Tang是多伦多大学机器学习组的一个博士生,他与Geoffrey Hinton和Ruslan Salakhutdinov一起工作,他们的研究领域包括机器学习、计算机视觉和认知科学。更具体地讲,他已经开发出多种高阶扩展用于在视觉深度学习中生成模型。
在下个月的波士顿深度学习峰会上,Charlie将演讲“结构深度学习(DEEP LEARNING WITH STRUCTURE)”。基于大量数据集的有监督神经网络训练最近在计算机视觉,语音识别,以及许多其他任务上取得了骄人的业绩。虽然非常灵活,但神经网络经常被批评,因为其内部表达是分布式代码并且缺乏解释性;这次峰会上的演期间,Charlie将揭示我们如何解决其中的一些问题。
在深度学习峰会之前,我们与Charlie有一个快速的问答,能够听到他更多关于深度学习发展和挑战方面的想法。
深度学习中已使用的最新进展的关键因素是什么?
三个关键因素是:
在深度学习领域,正在解决的问题有哪些类型?
在统计机器学习中,几乎所有问题目前正在使用深度学习技术进行研究。它们包括视觉和语音识别,强化学习,自然语言处理,医疗卫生应用,金融工程和其他许多种类。
你工作中实际应用的是什么?哪些部分最有可能受到影响?
深度学习革命允许训练有素的大数据模型,以大幅度提高准确性。这意味着许多人工智能识别任务现在可以自动进行,这在以前需要有人在循环中。
在未来5年,我们期待深度学习能有怎样的发展?
深度学习算法将被更多的任务逐步采用,将“解决”更多的问题。例如,5年前,面部识别算法准确率仍然比人类表现略差。然而,目前,超人类的性能展现在了主要的人脸识别数据集(LFW)和标准图像分类数据集(Imagenet)。在未来5年,越来越难的问题,比如视频识别,医学影像或文字处理将顺利通过深度学习算法解决。我们也可以期待深度学习算法被移植到商业产品,就像在过去的10年人脸检测器纳入消费相机那样。
在这个领域中,哪些进步最能激发你?
我觉得最令人兴奋的进步是支持深度学习算法的低能量移动硬件的可用性。这将不可避免地导致许多实时系统和移动产品,它们将成为我们日常生活的一部分。(翻译/王玮)