动态 | 微软亚洲研究院CVPR圆桌:机器学习火成这样,如何让计算机视觉“独立”发展?

「微软亚洲研究院创研论坛——CVPR 2017 论文分享会」于上周顺利举行。由微软亚洲研究院主办,清华大学媒体与网络技术教育部-微软重点实验室承办,中国图象图形学会视觉大数据专委会、中国计算机学会计算机视觉专委会协办。

会议期间,主办方邀请了在计算机视觉领域非常优秀的学术界、工业界代表们,针对在 CVPR 2017 发表的论文内容进行了分享。

本次圆桌讨论环节由微软亚洲研究院主管研究员罗翀主持,并邀请到了五位在计算机视觉领域的研究者们分享他们的心得见解。

  • 陈熙霖,中国科学院计算技术研究所研究员
  • 王蕴红,北京航空航天大学计算机学院副院长
  • 曾文军,微软亚洲研究院首席研究员
  • 林宙辰,北京大学信息科学技术学院教授
  • 齐国君,美国中佛罗里达大学计算机系助理教授

从左至右:陈熙霖、王蕴红、曾文军、林宙辰、齐国君

讨论点一:深度学习并非万能

AI 科技评论了解到,在本次研讨会上,第一个问题首先提及了深度学习对计算机视觉领域所产生的影响。诚然,深度学习的火热让很多经典问题的解决得到了很大的提升,但它作为一种「有效的」工具,是否真是万能的呢?

陈熙霖博士认为,计算机视觉实际上是一个很宽泛的领域,而不能单纯地用一个工具来代替一个领域。在解决问题的时候,还是需要结合问题背景进行考虑,再确定是否要用深度学习,否则很可能永远达不到最终目的。

王蕴红教授肯定了陈博士的说法,她认为研究人员在解决问题时,不应该把自己当成一个调参的工具。「在这个时候我们依然要关注到问题的本身是什么,怎么样才能够解决问题。所以任何一个工具都不是经久不衰的,但解决问题是经久不衰的,所以我们应该更多关注的是能力的培养。」

此外,林宙辰教授表示,深度学习与传统方法也开始有了一些结合,且前者的优点在某些问题上并不突出,因此还是应该需要注重专业知识的培养和积累。

讨论点二:arXiv 的利弊

此前 AI 科技评论曾经对 Yoav 与 Yann LeCun 关于 arXiv 的论战做了一番解析(详情可阅读此前文章《Yoav Goldberg 与 Yann LeCun 论战背后:arXiv 是个好平台,但和学术会议是两码事》),得出的结论是,arXiv 作为一个投递论文的平台,能够第一时间分享学者们的最新成果,但实际上它与论文的筛选与评比还是有不同的。本次圆桌上同样提及了这个问题,那么学者们都持什么样的观点呢?

几位老师的观点整体上比较一致,都认为 arXiv 作为一种交流工具,在学术领域还是起到了积极作用,但需要防止占坑现象的发生;此外,作为读者也应当仔细甄别,避免被误导的倾向。这与 AI 科技评论在征询其它老师们所得到的结论是相同的。

讨论点三:在视觉领域领域,如何设计基于强化学习的奖励函数?

罗翀老师提及,强化学习通过设置奖励函数,可以使算法的表现越来越好。如果我们也想用同样的方式训练计算机视觉的检测、分割与视频捕捉,其中的机制应当如何设计?

「如果要想拿视觉做一个类似于 AlphaGo 的评价函数,那么它不是单独视觉能解决的,而是需要把视觉能力的评估(Assessment)融入到一个智能系统中,然后由这个系统给出奖励或惩罚,甚至于给一个群体之间的反馈。这样的评价函数是可以做的,但它不是单独来自于计算机视觉的。」陈熙霖博士如是说,这个观点与齐国君教授的想法不谋而合,后者也认为视觉绝对不是一个单一系统,他表示可参考边学习边生成样本的方法(借助 GAN 或游戏的方法)来学习新的信息,产生一个闭环。

曾文军博士则提及了微软亚洲研究院机器学习组去年 NIPS 时的一个工作——对偶学习( AI 科技评论按:关于对偶学习,雷锋网邀请到了微软亚洲研究院主管研究员秦涛博士给我们做了一次硬创公开课《对偶学习的对称之美》),他表示这个同样是基于闭环的原理而进行学习的。

讨论点四:CVPR 于华人研究者

与 AAAI 2017 的论文投递情况一样,今年 CVPR 2017 华人同样占据了越来越多的份额,但华人论文在学术会议中的占比提升,却并没有很多令全球学术圈印象深刻的研究工作。

关于这一点,数位研究者们都认为,重点还是要关注研究工作的价值与影响力,而不仅仅停留在数目和入选率上。此外,林宙辰教授还指出,学者除了发表论文外,也应该积极参与交流,成为制定领域规则的主导者、发声者。

讨论点五:在深度学习的影响下,如何让计算机视觉社群独立发展?

正如王蕴红教授所提及的,「计算机视觉的传统问题依然存在,机器学习只解决了一部分,但是有很多问题还依然没有解决。」而曾文军博士也表示,只靠现有的深度学习,还有很多无法解释的东西(如黑箱问题等)。因此需要采用传统的自上而下的方法,加上知识图谱与逻辑内容,才有可能解决实际问题。

林宙辰教授表示,机器学习与计算机视觉相比,对特征的获取并不关心,而这正是后者所具备且着重研究的。此外,「有很多地方,计算机视觉会有它的独特之处。像立体视觉就需要基于一定的物理模型,所以我们不是简单地做一些端到端的东西就可以了。这两个领域的融合是『自古以来』就有的,并不是新产生的现象。」

而齐国君教授则指出,机器学习和计算机视觉并不是对立的竞争关系,更应该是一种依存与促进的关系。「机器学习在很多领域都有应用,但我觉得其中最成功、最有影响力的应用还是在计算机视觉,包括一系列的方法,比如深度学习中的卷积神经网络,这是一个纯粹的视觉问题,后来才引申出一系列新的应用领域。」

更多关于「微软亚洲研究院创研论坛——CVPR 2017 论文分享会」的精彩内容,欢迎观看直播回放。

地址:http://www.xuetangx.com/event/cvpr2017

原文发布于微信公众号 - AI科技评论(aitechtalk)

原文发表时间:2017-06-22

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏AI科技评论

iPIN 研究员李双印博士独家解析:循环聚焦机制如何与主题模型碰撞火花?

AI 科技评论按:李双印博士目前在香港科技大学攻读博士后,师从香港科技大学计算机系主任杨强教授。他的主要研究方向主要包括数据挖掘、人工智能、文本建模、深度学习,...

35312
来自专栏CSDN技术头条

自然语言处理的十个发展趋势

7月22-23日,第三届中国人工智能大会(CCAI 2017)在杭州国际会议中心盛大开幕。会上,哈尔滨工业大学刘挺教授对自然语言处理的发展趋势做了一次精彩的归纳...

1949
来自专栏AI科技大本营的专栏

CCAI 2017 | 自然语言处理的十个发展趋势

文/CSDN 苏靖芝 近日,由中国人工智能学会、阿里巴巴集团 & 蚂蚁金服主办,CSDN、中国科学院自动化研究所承办的第三届中国人工智能大会(CCAI 2017...

2736
来自专栏智能算法

麻省理工学院用深度学习教会计算机预测未来

【AI世代编者按】据外媒报道,通过部分基于人脑模型的算法,麻省理工学院的研究员让计算机可以通过分析照片去预测下一时刻的未来。 麻省理工学院计算机科学和人工智能实...

26811
来自专栏新智元

Hinton 四问:一个重要的关注点是让神经网络真正理解文档的内容

【新智元导读】 Hinton谈到了真正的人工智能、人工智能威胁和深度学习的下一个进展等问题。 国外网站gigaom 最近刊登了对Hinton专访的四个问题, ...

4066
来自专栏AI派

给初学者的深度学习入门指南

这个阶段有吴恩达、李飞飞、GeoffreyHinton、Ian Goodfellow等传奇人物的卓越贡献

965
来自专栏量化投资与机器学习

【Python量化投资】拟合具有非平稳特征的神经网络对股票进行预测

对建筑行业的股价进行分析预测 一、建筑行业规模 二、建筑行业市值前六公司 中国建筑 - 601668.SH 中国交建 - 601800.SH 中国中铁 - ...

1897
来自专栏专知

搞机器学习,不认识他们怎么行?

【导读】本文是机器学习爱好者Aditya Ananthram撰写的关于机器学习领域中几个大牛的介绍文章,对于今天AI的火热程度而言他们功不可没,因为如果没有这些...

3576
来自专栏人工智能快报

英伟达公开其自动驾驶深度学习机制

美国公司英伟达(NVIDIA)发文公开了其自动驾驶汽车的深度学习机制。 深度神经网络的自主学习能力是它的一个强项,因为随着经验的增加,机器变得越来越好;该能力也...

3224
来自专栏大数据文摘

深度学习,未来机器人的进化途径

1515

扫码关注云+社区