首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >动态 | 微软亚洲研究院CVPR圆桌:机器学习火成这样,如何让计算机视觉“独立”发展?

动态 | 微软亚洲研究院CVPR圆桌:机器学习火成这样,如何让计算机视觉“独立”发展?

作者头像
AI科技评论
发布2018-03-13 12:00:09
7880
发布2018-03-13 12:00:09
举报
文章被收录于专栏:AI科技评论AI科技评论

「微软亚洲研究院创研论坛——CVPR 2017 论文分享会」于上周顺利举行。由微软亚洲研究院主办,清华大学媒体与网络技术教育部-微软重点实验室承办,中国图象图形学会视觉大数据专委会、中国计算机学会计算机视觉专委会协办。

会议期间,主办方邀请了在计算机视觉领域非常优秀的学术界、工业界代表们,针对在 CVPR 2017 发表的论文内容进行了分享。

本次圆桌讨论环节由微软亚洲研究院主管研究员罗翀主持,并邀请到了五位在计算机视觉领域的研究者们分享他们的心得见解。

  • 陈熙霖,中国科学院计算技术研究所研究员
  • 王蕴红,北京航空航天大学计算机学院副院长
  • 曾文军,微软亚洲研究院首席研究员
  • 林宙辰,北京大学信息科学技术学院教授
  • 齐国君,美国中佛罗里达大学计算机系助理教授

从左至右:陈熙霖、王蕴红、曾文军、林宙辰、齐国君

讨论点一:深度学习并非万能

AI 科技评论了解到,在本次研讨会上,第一个问题首先提及了深度学习对计算机视觉领域所产生的影响。诚然,深度学习的火热让很多经典问题的解决得到了很大的提升,但它作为一种「有效的」工具,是否真是万能的呢?

陈熙霖博士认为,计算机视觉实际上是一个很宽泛的领域,而不能单纯地用一个工具来代替一个领域。在解决问题的时候,还是需要结合问题背景进行考虑,再确定是否要用深度学习,否则很可能永远达不到最终目的。

王蕴红教授肯定了陈博士的说法,她认为研究人员在解决问题时,不应该把自己当成一个调参的工具。「在这个时候我们依然要关注到问题的本身是什么,怎么样才能够解决问题。所以任何一个工具都不是经久不衰的,但解决问题是经久不衰的,所以我们应该更多关注的是能力的培养。」

此外,林宙辰教授表示,深度学习与传统方法也开始有了一些结合,且前者的优点在某些问题上并不突出,因此还是应该需要注重专业知识的培养和积累。

讨论点二:arXiv 的利弊

此前 AI 科技评论曾经对 Yoav 与 Yann LeCun 关于 arXiv 的论战做了一番解析(详情可阅读此前文章《Yoav Goldberg 与 Yann LeCun 论战背后:arXiv 是个好平台,但和学术会议是两码事》),得出的结论是,arXiv 作为一个投递论文的平台,能够第一时间分享学者们的最新成果,但实际上它与论文的筛选与评比还是有不同的。本次圆桌上同样提及了这个问题,那么学者们都持什么样的观点呢?

几位老师的观点整体上比较一致,都认为 arXiv 作为一种交流工具,在学术领域还是起到了积极作用,但需要防止占坑现象的发生;此外,作为读者也应当仔细甄别,避免被误导的倾向。这与 AI 科技评论在征询其它老师们所得到的结论是相同的。

讨论点三:在视觉领域领域,如何设计基于强化学习的奖励函数?

罗翀老师提及,强化学习通过设置奖励函数,可以使算法的表现越来越好。如果我们也想用同样的方式训练计算机视觉的检测、分割与视频捕捉,其中的机制应当如何设计?

「如果要想拿视觉做一个类似于 AlphaGo 的评价函数,那么它不是单独视觉能解决的,而是需要把视觉能力的评估(Assessment)融入到一个智能系统中,然后由这个系统给出奖励或惩罚,甚至于给一个群体之间的反馈。这样的评价函数是可以做的,但它不是单独来自于计算机视觉的。」陈熙霖博士如是说,这个观点与齐国君教授的想法不谋而合,后者也认为视觉绝对不是一个单一系统,他表示可参考边学习边生成样本的方法(借助 GAN 或游戏的方法)来学习新的信息,产生一个闭环。

曾文军博士则提及了微软亚洲研究院机器学习组去年 NIPS 时的一个工作——对偶学习( AI 科技评论按:关于对偶学习,雷锋网邀请到了微软亚洲研究院主管研究员秦涛博士给我们做了一次硬创公开课《对偶学习的对称之美》),他表示这个同样是基于闭环的原理而进行学习的。

讨论点四:CVPR 于华人研究者

与 AAAI 2017 的论文投递情况一样,今年 CVPR 2017 华人同样占据了越来越多的份额,但华人论文在学术会议中的占比提升,却并没有很多令全球学术圈印象深刻的研究工作。

关于这一点,数位研究者们都认为,重点还是要关注研究工作的价值与影响力,而不仅仅停留在数目和入选率上。此外,林宙辰教授还指出,学者除了发表论文外,也应该积极参与交流,成为制定领域规则的主导者、发声者。

讨论点五:在深度学习的影响下,如何让计算机视觉社群独立发展?

正如王蕴红教授所提及的,「计算机视觉的传统问题依然存在,机器学习只解决了一部分,但是有很多问题还依然没有解决。」而曾文军博士也表示,只靠现有的深度学习,还有很多无法解释的东西(如黑箱问题等)。因此需要采用传统的自上而下的方法,加上知识图谱与逻辑内容,才有可能解决实际问题。

林宙辰教授表示,机器学习与计算机视觉相比,对特征的获取并不关心,而这正是后者所具备且着重研究的。此外,「有很多地方,计算机视觉会有它的独特之处。像立体视觉就需要基于一定的物理模型,所以我们不是简单地做一些端到端的东西就可以了。这两个领域的融合是『自古以来』就有的,并不是新产生的现象。」

而齐国君教授则指出,机器学习和计算机视觉并不是对立的竞争关系,更应该是一种依存与促进的关系。「机器学习在很多领域都有应用,但我觉得其中最成功、最有影响力的应用还是在计算机视觉,包括一系列的方法,比如深度学习中的卷积神经网络,这是一个纯粹的视觉问题,后来才引申出一系列新的应用领域。」

更多关于「微软亚洲研究院创研论坛——CVPR 2017 论文分享会」的精彩内容,欢迎观看直播回放。

地址:http://www.xuetangx.com/event/cvpr2017

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2017-06-22,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 AI科技评论 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 讨论点一:深度学习并非万能
  • 讨论点二:arXiv 的利弊
  • 讨论点三:在视觉领域领域,如何设计基于强化学习的奖励函数?
  • 讨论点四:CVPR 于华人研究者
  • 讨论点五:在深度学习的影响下,如何让计算机视觉社群独立发展?
相关产品与服务
云直播
云直播(Cloud Streaming Services,CSS)为您提供极速、稳定、专业的云端直播处理服务,根据业务的不同直播场景需求,云直播提供了标准直播、快直播、云导播台三种服务,分别针对大规模实时观看、超低延时直播、便捷云端导播的场景,配合腾讯云视立方·直播 SDK,为您提供一站式的音视频直播解决方案。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档