动态 | 微软亚洲研究院CVPR圆桌:机器学习火成这样,如何让计算机视觉“独立”发展?

「微软亚洲研究院创研论坛——CVPR 2017 论文分享会」于上周顺利举行。由微软亚洲研究院主办,清华大学媒体与网络技术教育部-微软重点实验室承办,中国图象图形学会视觉大数据专委会、中国计算机学会计算机视觉专委会协办。

会议期间,主办方邀请了在计算机视觉领域非常优秀的学术界、工业界代表们,针对在 CVPR 2017 发表的论文内容进行了分享。

本次圆桌讨论环节由微软亚洲研究院主管研究员罗翀主持,并邀请到了五位在计算机视觉领域的研究者们分享他们的心得见解。

  • 陈熙霖,中国科学院计算技术研究所研究员
  • 王蕴红,北京航空航天大学计算机学院副院长
  • 曾文军,微软亚洲研究院首席研究员
  • 林宙辰,北京大学信息科学技术学院教授
  • 齐国君,美国中佛罗里达大学计算机系助理教授

从左至右:陈熙霖、王蕴红、曾文军、林宙辰、齐国君

讨论点一:深度学习并非万能

AI 科技评论了解到,在本次研讨会上,第一个问题首先提及了深度学习对计算机视觉领域所产生的影响。诚然,深度学习的火热让很多经典问题的解决得到了很大的提升,但它作为一种「有效的」工具,是否真是万能的呢?

陈熙霖博士认为,计算机视觉实际上是一个很宽泛的领域,而不能单纯地用一个工具来代替一个领域。在解决问题的时候,还是需要结合问题背景进行考虑,再确定是否要用深度学习,否则很可能永远达不到最终目的。

王蕴红教授肯定了陈博士的说法,她认为研究人员在解决问题时,不应该把自己当成一个调参的工具。「在这个时候我们依然要关注到问题的本身是什么,怎么样才能够解决问题。所以任何一个工具都不是经久不衰的,但解决问题是经久不衰的,所以我们应该更多关注的是能力的培养。」

此外,林宙辰教授表示,深度学习与传统方法也开始有了一些结合,且前者的优点在某些问题上并不突出,因此还是应该需要注重专业知识的培养和积累。

讨论点二:arXiv 的利弊

此前 AI 科技评论曾经对 Yoav 与 Yann LeCun 关于 arXiv 的论战做了一番解析(详情可阅读此前文章《Yoav Goldberg 与 Yann LeCun 论战背后:arXiv 是个好平台,但和学术会议是两码事》),得出的结论是,arXiv 作为一个投递论文的平台,能够第一时间分享学者们的最新成果,但实际上它与论文的筛选与评比还是有不同的。本次圆桌上同样提及了这个问题,那么学者们都持什么样的观点呢?

几位老师的观点整体上比较一致,都认为 arXiv 作为一种交流工具,在学术领域还是起到了积极作用,但需要防止占坑现象的发生;此外,作为读者也应当仔细甄别,避免被误导的倾向。这与 AI 科技评论在征询其它老师们所得到的结论是相同的。

讨论点三:在视觉领域领域,如何设计基于强化学习的奖励函数?

罗翀老师提及,强化学习通过设置奖励函数,可以使算法的表现越来越好。如果我们也想用同样的方式训练计算机视觉的检测、分割与视频捕捉,其中的机制应当如何设计?

「如果要想拿视觉做一个类似于 AlphaGo 的评价函数,那么它不是单独视觉能解决的,而是需要把视觉能力的评估(Assessment)融入到一个智能系统中,然后由这个系统给出奖励或惩罚,甚至于给一个群体之间的反馈。这样的评价函数是可以做的,但它不是单独来自于计算机视觉的。」陈熙霖博士如是说,这个观点与齐国君教授的想法不谋而合,后者也认为视觉绝对不是一个单一系统,他表示可参考边学习边生成样本的方法(借助 GAN 或游戏的方法)来学习新的信息,产生一个闭环。

曾文军博士则提及了微软亚洲研究院机器学习组去年 NIPS 时的一个工作——对偶学习( AI 科技评论按:关于对偶学习,雷锋网邀请到了微软亚洲研究院主管研究员秦涛博士给我们做了一次硬创公开课《对偶学习的对称之美》),他表示这个同样是基于闭环的原理而进行学习的。

讨论点四:CVPR 于华人研究者

与 AAAI 2017 的论文投递情况一样,今年 CVPR 2017 华人同样占据了越来越多的份额,但华人论文在学术会议中的占比提升,却并没有很多令全球学术圈印象深刻的研究工作。

关于这一点,数位研究者们都认为,重点还是要关注研究工作的价值与影响力,而不仅仅停留在数目和入选率上。此外,林宙辰教授还指出,学者除了发表论文外,也应该积极参与交流,成为制定领域规则的主导者、发声者。

讨论点五:在深度学习的影响下,如何让计算机视觉社群独立发展?

正如王蕴红教授所提及的,「计算机视觉的传统问题依然存在,机器学习只解决了一部分,但是有很多问题还依然没有解决。」而曾文军博士也表示,只靠现有的深度学习,还有很多无法解释的东西(如黑箱问题等)。因此需要采用传统的自上而下的方法,加上知识图谱与逻辑内容,才有可能解决实际问题。

林宙辰教授表示,机器学习与计算机视觉相比,对特征的获取并不关心,而这正是后者所具备且着重研究的。此外,「有很多地方,计算机视觉会有它的独特之处。像立体视觉就需要基于一定的物理模型,所以我们不是简单地做一些端到端的东西就可以了。这两个领域的融合是『自古以来』就有的,并不是新产生的现象。」

而齐国君教授则指出,机器学习和计算机视觉并不是对立的竞争关系,更应该是一种依存与促进的关系。「机器学习在很多领域都有应用,但我觉得其中最成功、最有影响力的应用还是在计算机视觉,包括一系列的方法,比如深度学习中的卷积神经网络,这是一个纯粹的视觉问题,后来才引申出一系列新的应用领域。」

更多关于「微软亚洲研究院创研论坛——CVPR 2017 论文分享会」的精彩内容,欢迎观看直播回放。

地址:http://www.xuetangx.com/event/cvpr2017

原文发布于微信公众号 - AI科技评论(aitechtalk)

原文发表时间:2017-06-22

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏新智元

【微软语音识别新突破,错误率降至5.1%】黄学东:新的行业里程碑

【新智元导读】微软语音识别系统取得最新突破:微软的语音对话研究小组在Switchboard语音识别任务中,将错误率从去年的 5.9% 再一次降低到 5.1%,达...

2755
来自专栏企鹅号快讯

深度学习即将非法?欧盟《一般数据保护条例》五月生效

选自Analytics India 作者:Richa Bhatia 机器之心编译 《欧盟一般数据保护条例》(General Data Protection Re...

1818
来自专栏机器之心

学界 | Facebook ICLR 2017研究成果概述,对话研究的创新与优势

选自Facebook 作者:Alexandre Lebrun等 参与:李泽南、微胖 深度学习盛会 ICLR 2017 正在法国的土伦举行,Facebook 在大...

2587
来自专栏大数据文摘

张钹院士:深度学习优势与短板 中国AI机遇和挑战(最新演讲实录)

1609
来自专栏机器之心

深度学习即将非法?欧盟《一般数据保护条例》五月生效

2527
来自专栏YoungGy

消费者理论概述

消费者理论是构建经济学大厦的基石。 本文先从优化问题讲起,构建经济学基本的benefit-cost模型,然后从消费者的角度阐述consumer theory...

1959
来自专栏机器人网

机器人“进化论”:可模拟人类的“自然选择”

---- 达尔文在其《进化论》中宣称,生命可在“自然选择”过程中实现进化。在这一过程中,生命身上或多或少都会出现某些有益于他们的特征。现在,美国密歇根州立大学...

2363
来自专栏大数据挖掘DT机器学习

听说你想做 AI 工程师?

AI 时代已经到来!人工智能已经不是只有在科幻小说和电影中才会出现的东西,现在它离我们越来越近,而且已经渗透到各行各业。从百度的无人驾驶车,到现在的阿里人脸识...

33812
来自专栏新智元

【Science AI特辑】变革了人类社会的基础科学,正在遭遇AI革命

【新智元导读】 7月7日,Science发布最新一期杂志,本期为 AI 特辑。人工智能本身是一门科学,现在,它也在变革科学。《Science》以AI在科学研究...

3043
来自专栏人工智能头条

自然语言处理的十个发展趋势

1413

扫描关注云+社区