当机器学习遇到计算机视觉——下篇

上一篇文章中,我们为大家介绍了计算机视觉这一领域的概况,并讨论了基于决策森林的像素分类法。目前这个强有效的方法已经被广泛运用在了医疗成像和Kinect体感设备上。本文中,我们将着眼于最近十分风靡的深层神经网络(deep neural networks)问题,并介绍其在计算机视觉领域内的成功运用,最后我们将带大家一起放眼计算机视觉和机器学习的未来。

深层神经网络

在过去的几年里,我们视觉领域的研究者们所使用的测试数据集,无论在质量上还是数量上,都实现了飞跃。这些进步在很大程度得益于众包,使数据集达到了百万张已标记图像的规模。其中一个最具挑战性的测试数据集ImageNet,目前已包含几百万张由数万种不同图像分类标签标注的图片。

多年来ImageNet测试数据集识别工作进展较缓的局面终于在2012年被Krizhevsky等人的成果所打破。他们向我们展示了GPU通用计算是如何通过一些看似细微的算法改进,从而更加深层地训练卷积神经网络(convolutional neural networks)。最终, ImageNet中1000个图像分类测试的准确性的得到了显著的提升,并获得了大众媒体的广泛关注,甚至导致很多相关的初创公司被大笔收购。从那以后,“深度学习”成为了计算机视觉领域一个非常热门的话题,而近期发表的文章也延伸到了对物体定位、脸部识别和人体姿势估计等方法的探讨。

展望未来

深层卷积网络毫无疑问是相当强大的,但它可以解决计算机视觉领域的一切问题吗?我们确信在未来的几年中,它仍会备受关注并继续推动着这个领域的研究;但同时我们也相信未来还会有其他一个或两个新的突破性改变。谁也说不准会有哪些突破,但我们可以和大家分享一些我们认为很有可能实现的突破点:

图像表述(Representations):以上的网络模型只完成了对图像内容的简单表述的预测,并没有深入理解例如图像中各物体的位置、物体之间如何相互联系以及某一特定物体在实际生活中的状态(例如我们无法仅仅根据一个人头发较为光泽和他们手里拿着吹风机,就很有把握地推断这个人的头发是湿的)。针对这类问题,微软CoCo等新型测试数据集对那些包含多个对象、无法聚焦到其中某一个的抽象图像,提供更细化的分类标注,从而帮助计算机更好的理解图片含义。

运行效率(Efficiency):尽管对测试图片的深层网络评估过程可以通过并行计算来加速,但当前的神经网络的每一个训练样例都要遍历网络中的所有节点来输出结果,并没有运用我们在上一篇中提到的条件计算的概念。此外,即使配备高速的GPU,训练整个神经网络也要花费数天甚至数周的时间,极大限制了整个实验的周期。

结构化学习(Structure learning):深层卷积网络基本是由精心的手工设计实现的,历经多年的研究后具有很强的刚性结构。例如,当其中一层或几层发生变化就会影响模型整体的预测。除了简单粗暴地输入特定参数来最优化网络的形态,我们希望未来可以实现直接从数据中层面增加网络结构的灵活性。

近年来,我们在后面两个方面的研究已经有了一些阶段性的进展。尤其是在决策丛林模型(decision jungles)的研究方面取得了令人可喜的成果:根部相连接的决策有向无环图。你可以把一个决策有向无环图看做一个子节点相通的决策树,因此一个子节点可以存在多个父节点。相较于传统的决策树模型,我们不但证明了这种模型在内存消耗上降低了一个数量级,同时它还能大大提高模型的泛化能力。有向无环图乍一看很像神经网络,但是有两个重要的不同点:第一,其结构可以通过模型的参数进行修改;第二,有向无环图保留了决策树中高效的逻辑运算,即一个测试样例只沿着有向无环图的一条路径传递,而不是像神经网络一样遍历所有节点。目前,我们正在积极尝试结合其他深度学习的形式,譬如Stacking 和Entanglement ,使得决策丛林模型能够真正有效地替代深层神经网络。

如果你对运用决策丛林模型解决问题感兴趣,可以使用Azure机器学习云平台 中的Gemini模块进行深入研究。

总的来说,计算机视觉前途的一片光明。当然,这也很大程度上得益于对机器学习的研究。近年来计算机视觉领域的快速发展已令人十分振奋,但我们坚信未来会看到它更多惊艳的成果。

原文发布于微信公众号 - 智能计算时代(intelligentinterconn)

原文发表时间:2015-10-12

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏专知

最新|DeepMind获得人工智能会议UAI2018最佳论文,一种神经网络可扩展验证的对偶方法

【导读】UAI大会全称为Conference on Uncertainty in Artificial Intelligence,立足于不确定性人工智能领域,主...

10310
来自专栏计算机视觉战队

深度学习的昨天、今天和明天

机器学习是人工智能领域的一个重要学科。 自从20世纪80年代以来, 机器学习在算法、理论和应用等方面都获得巨大成功。2006年以来, 机器学习领域中一个叫“ 深...

17170
来自专栏CDA数据分析师

深入浅出,一篇超棒的机器学习入门文章

? 原文链接:http://www.cnblogs.com/subconscious/p/4107357.html 在本篇文章中,我将对机器学习做个概要的介绍...

32570
来自专栏企鹅号快讯

2018 年最值得期待的学术进展——致人工智能研究者们的年终总结

原标题:2018 年最值得期待的学术进展——致人工智能研究者们的年终总结 ? 来源:AI科技评论 概要:这里,我们为大家奉上机器学习学者 Alex Honcha...

19870
来自专栏星流全栈

革命性的Deep Learning,深度学习十大应用!

21430
来自专栏人工智能头条

神经网络不可思议的声誉

17750
来自专栏AI科技评论

360 副总裁颜水成教授: 深度学习的研发目标及 1×1 卷积的功能 | CCF-GAIR 2017

7 月 7 日,雷锋网承办的第二届 CCF-GAIR 全球人工智能与机器人峰会在深圳如期开幕。奇虎 360 副总裁、首席科学家、IEEE Fellow、IAPR...

29670
来自专栏数据派THU

清华出品 | 人脸识别最全知识图谱

自20世纪下半叶,计算机视觉技术逐渐地发展壮大。同时,伴随着数字图像相关的软硬件技术在人们生活中的广泛使用,数字图像已经成为当代社会信息来源的重要构成因素,各种...

33740
来自专栏AI科技评论

腾讯AI Lab两大算法刷新人脸识别与检测纪录,秉承「基础研究+落地应用」之路

AI 科技评论按:12 月 18 日,腾讯 AI Lab 宣布,其研发的人脸算法 Face R-FCN 和 Face CNN 分别在人脸检测平台 WIDER F...

32390
来自专栏专知

Google AI发起包容性图像比赛(The Inclusive Images Competition)

【导读】大型公开可用的图像数据集(如ImageNet,Open Images和Conceptual Captions)是开发有价值的机器学习(ML)模型的必要和...

17530

扫码关注云+社区

领取腾讯云代金券