首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

北电院提出图像美学评价新方法&研究生参会总结

论文地址:

https://arxiv.org/abs/1708.07089

摘要

图像的美学质量评价是一项计算机视觉领域很有挑战性的工作,其与种类繁多的语义内容和摄影绘画技巧都有着密不可分的关系。近期的相关研究工作利用深度卷积神经网络(Deep ConvolutionalNeural Network:DCNN),能够给出一幅图美学质量的“高”与“低”的二分类,也能够给出一个连续的美学质量数值评价。然而仅仅给出一个标量的评价不能很好的描述人类美感的多样性。本论文提出了基于深度学习的图像美学质量评价分数分布(向量)预测方法,不同于以往的单标量评价,本论文方法能够给出一幅图像的美学质量评价分数分布,能够更好的描述人类美感的多样性。传统的深度学习最小化预测标量或一般向量与人类标记的差异,无法直接应用于美学质量评价分数分布这种有序分布向量的预测中。因此,本文提出了一种基于累积JS散度的卷积神经网络(CNN basedon the Cumulative distribution with Jensen-Shannon divergence:CJS-CNN)用于预测图像美学质量评价分数分布。并且,本文还提出了一种基于峰度统计量的可靠性敏感的学习算法,该算法只需要归一化的评价分数分布数据就可以进行可靠性敏感的学习,而之前基于评价人数的可靠性敏感学习算法需要归一化之前完整的评价分数分布数据。在大规模图像美学数据集上的实验结果验证了本论文方法的有效性和优势。

--------------------------------------------------------------------------------------------------

本组研究生吴乐赴美参会,以下是吴乐写的参会总结

---------------------------------------------------------------------------------------------------

第32届AAAI大会(AAAI 2018)日前在美国新奥尔良拉开帷幕,并于当地时间2月2日至7日为人工智能研究者们带来一场丰富的知识盛宴。作为一名计算机视觉领域的研究生有幸来到本次大会,并就与金鑫老师发表的论文Predicting AestheticScore Distribution through Cumulative Jensen-Shannon Divergence进行了简单的报告。

图1新奥尔良市区

此次大会持续时间为6天,内容涉及计算机视觉,机器学习,知识图谱,自然语言处理,社交网络,深度学习等等人工智能领域热点话题,从传统方法到神经网络,可以说此次大会的内容也代表了人工智能领域研究的缩影。大会的安排相对紧凑,前两天以研讨会和论坛的形式为主,后三天以论文讲解为主,最后一天进行邀请演讲。我们的论文被安排在会议第四天也就是2月5日的论文讲解环节之中。

前两天的论坛内容主要针对热点的人工智能具体研究领域进行介绍和讨论,主要以邀请讲解为主,研讨会主要对人工智能前沿领域进行深入介绍。论坛面向的是第一次了解该领域的人,而研讨会针对的是对该领域有一定研究的学者。我所主要关注的主要有两个论坛,第一个是对抗性机器学习领域,该领域是人工智能和信息安全的交叉领域,研究内容主要是如何通过产生具有干扰性的样本使神经网络产生错误的输出以及各种针对此类型攻击的防御手段。第二个是反向强化学习论坛,强化学习主要是对学习任务提供策略,而反向强化学习则相反通过任务实例学习奖励函数。活动方在这两天也举办了一些有意思的活动,比如学生交流晚宴、大会欢迎晚宴、学生与院士一同晚餐等活动,在活动中也遇到了像周志华老师这样的学者,可以说大会的交流意义远大于会议本身。

图2通过对抗性网络产生对抗性生成样本

论文介绍可以说是整个会议的核心和精华,来自世界各地的学者和学生齐聚一堂,根据研究领域划分出一个个分会场,通过大家交流的经验和创新点的学习,也可以丰富自己对本领域知识的理解和认知,形成新的理论和观点。在其他分会场中,有很多前沿内容引起了我的关注,比如表示学习(在深度学习领域内,表示是指通过模型的参数,采用何种形式、何种方式来表示模型的输入观测样本X。表示学习指学习对观测样本X有效的表示)、Probabilistic Machine Learning等等。

图3表示学习的应用

在我的论文介绍中,我着重介绍了文章的解决问题和创新点方面的内容,由于时间限制,不能将每个原理一一阐述。我所在会场侧重应用,大家研究的内容五花八门,有用深度学习作画的,也有用深度学习演奏音乐的,令我大开眼界,大家在介绍中充分认可和交流了彼此观点,观众的热情也很高,很多老外干脆坐在地上聆听,介绍结束后我们互相留下了联系方式,方便日后交流。

图4我在介绍论文

值得一提的时,虽然大会白天会议时间有限,但为了方便大家进行深入交流,在会议介绍的当天晚上会举行会议深入交流环节,每个论文至少派一名作者代表将论文海报张贴于大厅之中,每个人可以到感兴趣的论文前与作者详细交流。整个会场几乎人山人海,即使这样也没能阻挡大家的热情,虽然很多问题被问过很多遍,我还是很高兴能和不同地区的学生和老师进行交流。

图5我与海报

大会最后一天的会议只有半天,相比之前的热度最后一天人就比较少了,能明显感觉到连讲台上的人都有些懈怠了。听完了计算机视觉与深度学习分会场以后,我的会议之旅也宣告落下帷幕,大会没有任何谢幕仪式,纵使有再多遗憾和不舍,也只能和认识的小伙伴们各自奔向归途。

图6看图作诗

在会议之余,我也参观了这座年轻的城市,作为曾经的法国殖民地,留下了许多法国建筑。

图7法国区皇家街

这里的爵士乐气息十分浓厚,在大街上走几步就能看到街头表演的艺人。

图8街头表演的艺人

作为地标的杰克逊广场位于法国区的中央,有名的圣路易主教堂也坐落于此处。

图9杰克逊广场

我宾馆所在的街道在下午和晚上还会举行全市规模的二月狂欢节游行,整个街道会被警察封锁,大家跳着各种舞蹈,开着五颜六色的装饰车,骑着白马,从整个街道从南向北游行,很晚才结束,车上会有小礼物抛出,每天最开心的就是跟小伙伴炫耀战利品了。

图10二月狂欢节

通过这次大会,我看到了更为广阔的学术视野,使我更加坚定了对人工智能这一研究领域的热爱。短短一周的会议对我而言不仅仅是一次体验与交流,更是一次学习与考验。我会不断关注最新的学术动态,继续努力提升自己的学习和科研能力,为更为智能的未来社会做出自己的贡献。

--------------------------------------------------------------------------------------------------

最后祝大家在即将到来的新春佳节里开开心心,万事如意!

---------------------------------------------------------------------------------------------------

欢迎关注北京电子科技学院

可视计算与安全组官方微信

  • 发表于:
  • 原文链接http://kuaibao.qq.com/s/20180214G0B8QG00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

相关快讯

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券