犀牛鸟·学问 | ECCV 2018论文宣讲研讨会回顾(二)

由中国图象图形学学会和腾讯高校合作主办、中国图象图形学学会视觉大数据专委会承办的“ECCV 2018 China Pre-Conference论文宣讲研讨会”于7月30日在深圳腾讯大厦顺利举办。150余位来自学界、工业界的研究人员参与了本次研讨会。会议日程包含12篇论文口头报告,20篇论文海报展示,并邀请到多位业界专家开展题为“计算机视觉的今天与明天,城内与城外”的圆桌论坛,分享各自在计算机视觉领域的最新研究结果和相关技术观点。

论文口头报告-12篇

哈尔滨工业大学(深圳)张正博士带来题为“Highly-Economized Multi-View Binary Compression for Scalable Image Clustering”的报告,张正博士针对大规模图像聚类问题进行阐述。先前的MVIC算法存在计算复杂度高,存储开销大等缺陷,为解决这些问题,本文提出binary code learning 方法。使用汉明距离取代传统的欧式距离,能够有效降低算法时间复杂度。同时通过将实数值转换为二进制码,能够有效节约内存开销。

▲  张正博士

接着,中山大学胡建芳教授演讲题目为“ Deep Bilinear Learning for RGB-D Action Recognition”,主要介绍了RGB-D动作识别领域,报告挖掘了模态与时间之间复杂的结构信息,提出了一个新的立方体特征,用于表征不同进度水平和模态的动作。同时提出了一个深度双线性网络用于学习立方体特征块的模态-时间的互信息。

▲  胡建芳教授

中科院自动化所的李成龙教授论述的“Cross-Modal Ranking with Soft-Consistency and Noisy Labels for Robust RGB-T Tracking ”的报告关注于针对RGB-T 图像的单目标跟踪问题。为了有效融合可见光和热红外两种视觉模态信息实现稳健地目标跟踪,论文提出一种新的跨模态排序算法,联合多模态信息构建鲁棒的目标特征。提出的排序算法具有以下优势:第一,针对不同视觉模态的异质性质,提出一种鲁棒的跨模态一致性约束,能够有效利用模态之间的协同性和异质性。第二,针对排序种子点噪声问题,提出一种基于l1范数稀疏学习的种子点优化方法。最后,使用一个统一的优化框架联合求解上述问题。

▲  李成龙教授(由博士生王逍代讲)

腾讯优图2018年ECCV共入选11篇论文。腾讯优图专家研究员戴宇荣博士主要介绍了其中3篇文章。第一篇为“Pairwise Body-Part Attention for Recognizing Human-Object Interactions”。该文章关注人-物体交互领域的识别问题,针对以往的工作将人看做整体,平等对待各个身体部位问题,本文引入注意力机制,区别对待人体不同区域对识别结果的影响,同时考虑了不同人体区域之间的相互关系。第二篇为“Deep High Dynamic Range Imaging with Large Foreground Motions”。该论文针对具有大尺度前景运动的动态场景的高动态范围(HDR)成像问题,提出了第一个非基于流的深度模型。通过将HDR成像问题定义为无光流的图像转换问题,文章提出的图像转换网络能够在存在完全遮挡,饱和和曝光不足的情况下,自动修复HDR成像细节信息。第三篇为“Deep Video Generation, Prediction and Completion of Human Action Sequences”。本位针对人体动作序列,提出了一个通用的,两阶段的深度网络用于生成没有约束或任意数量约束的人类动作视频。该网络能够统一处理视频生成,视频预测(给定第一帧),视频补齐(给定首尾视频帧)问题。

▲  戴宇荣研究员

腾讯 AI Lab高级研究员凌永根进行了“Modeling Varying Camera-IMU Time Offset in Optimizatin-based Visual-Inertial Odometry”的介绍。腾讯AI Lab此次ECCV,共有19篇文章入选。由于相机和IMU(惯导测量单元)这两种传感器提供的信息对于运动估计具有很强的互补性,所以把这两种传感器信息融合在一起用于运动估计被学界证实是很有效的。然而,过去大部分的相机和IMU融合方法都是假设使用了全局快门相机和同步的传感器测量。这个假设在现实情况下往往是不成立的。因为在大部分的消费电子产品里,装配的往往是卷帘快门相机和非同步的传感器测量。为了解决这个问题,本文提出了一种基于非线性优化的单目视觉惯导融合方法。这种方法对相机和IMU之间的延时进行建模,并把其当作一个可动态变化的量。本文提出的这种方法可以统一处理使用卷帘快门相机带来的图像失真问题和非同步的传感器测量问题。同时,为了加速优化过程中所需要的可变长度IMU测量积分,本文提出了一种基于动态规划和红黑树的高效计算方法。

▲  凌永根研究员

University of Rochester/腾讯 AI Lab实习生冯洋分析了“Video Re-localization”的发展与现状。本文提出了计算机视觉领域新的研究方向,视频重定位并提出了相应的数据集。研究动机是给出查询视频,如何精确地在参考视频中定位和查询视频语义相似的视频片段。区别于已有研究领域,特别是视频拷贝检测,视频重定位侧重于定位语义相似的视频片段。

▲  冯洋博士生

中山大学龚科博士则阐明了“Instance-level human parsing via part grouping network”主题。本文关注于实例人体解析领域。通过像素分组实现人体模块的解析,以及人体模块分组实现单个人体实例的解析。

龚科博士

图森未来的王乃岩研究员介绍了“Data Driven Sparse Structure Selection for Deep Neural Networks”。本文侧重于解决深度模型实际部署的大小和运算速度问题,设计了一种新的简单有效的模型裁剪端对端网络。本文通过引入新的可学习参数——比例因子,缩放神经元,残差模块等网络子模块的输出。通过使用稀疏正则化和修正的随机加速近端梯度优化方法优化目标函数。通过裁剪比例因子为0的网络模块,实现网络的剪枝和压缩。

▲  王乃岩博士

奈良先端科学技术大学院大学伍洋教授提出“Pose-Normalized Image Generation for Person Re-identification”。本文中通过提出一种新的基于生成对抗网络的深度图像生成模型来处理行人重识别领域中常见的两个问题:行人重识别领域缺乏跨角度的训练数据对和如何在大量姿态变化情况下,学习有辨别的身份敏感和角度不变的特征。该网络以姿势为条件的合成真实的人像图片,用于行人重识别中的姿势规范化。通过合成图像和真实图像,学习一种新的深度行人重识别特征类型,以此摆脱姿势变化的影响。

▲  伍洋教授

接着,南京理工大学张姗姗报告到“Person search via a mask-guided two-stream model”内容。行人检索包括行人检测和行人重识别两个子任务。本文考虑这两个任务之间相互关系,将这关系中的先验信息融入到模型中去。行人检测关注的是行人的共性,行人重识别关注的行人的个性。本文通过独立训练两个子模块,利用行人的分割掩膜信息,提取行人前景,并结合部分背景信息,进行特征融合。

▲  张姗姗教授

随后,中国科学院大学王树徽教授详解“Less is More: Picking Informative Frames for Video Captioning”。 为解决视频描述领域内已有方法提取的视频帧存在大量冗余信息的问题,本文提出一个即插即用的网络PickNet,融合强化学习的方法提取视频中最有用的信息。强化学习最大化挑选的视频帧的视觉多样性以及最小化视频帧间的文本差异。

▲  王树徽教授

最后,大连理工大学王栋集中在“Real-time ‘Actor-Critic’ Tracking”的主题分享。本文将强化学习的方法利用到单目标跟踪领域。区别于已有的利用强化学习进行单目标跟踪,需要进行多步迭代的方法,本文提出直接回归下一帧目标位置偏移量和尺度变化量的方法,一步解决单目标跟踪问题。同时Critic网络融合重确认机制,能够有效解决长时跟踪易出现的目标丢失现象。

▲ 王栋教授

此次ECCV 2018论文宣讲研讨会已经落幕,ECCV 涵盖了计算机视觉领域等多方面应用,即重视基础研究,也重视实际应用,因此也越来越具影响力,为计算机视觉领域及的专家学者们提供了一个绝佳的交流平台,我们也将持续关注ECCV 2018,为大家带来最新分享。

原文发布于微信公众号 - 腾讯高校合作(Tencent_UR)

原文发表时间:2018-08-03

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏AI科技评论

学界 | 小米加入 AI 研究大家庭!联合西工大推出基于注意力机制的普通话语音识别算法

AI 科技评论按:小米近期发布了自己的 AI 音箱,加入了智能家居的战局。正当我们觉得小米会不会只是蹭“人工智能”热点的时候,小米的这篇论文证明了自己真的是把人...

2887
来自专栏AI科技评论

澳门大学讲座教授陈俊龙:从深度强化学习到宽度强化学习 - 结构,算法,机遇及挑战

AI 科技评论按:2018 年 5 月 31 日-6 月 1 日,中国自动化学会在中国科学院自动化研究所成功举办第 5 期智能自动化学科前沿讲习班,主题为「深度...

1296
来自专栏AI科技评论

BAT资深算法工程师「Deep Learning」读书系列分享(一)

AI科技评论按:「Deep Learning」这本书是机器学习领域的重磅书籍,三位作者分别是机器学习界名人、GAN的提出者、谷歌大脑研究科学家 Ian Good...

39612
来自专栏AI科技评论

大牛讲堂 | 深度学习Sequence Learning技术分享

雷锋网按:本文作者都大龙,2011年7月毕业于中科院计算技术研究所;曾任百度深度学习研究院(IDL)资深研发工程师,并连续两次获得百度最高奖—百万美金大奖;现在...

3846
来自专栏ATYUN订阅号

使用实体嵌入的结构化数据进行深度学习

嵌入(embedding)的想法来自于NLP(word2vec)

3048
来自专栏数据魔术师

机器学习|刘博士谈机器学习--起手式

1658
来自专栏CreateAMind

深度学习的效果为何如此惊人?看看全息理论怎么说

摘要: 大家一定不会对近几年来日益热门的深度学习技术感到陌生。但是大家有没有想过,构成深度学习基础的深层卷积网络并不复杂,为什么这样的结构解决实际问题时能够取得...

1193
来自专栏来自地球男人的部落格

从AdaBoost到GBDT(part 2)

注:本文假设读者已经有了AdaBoost和GBDT的背景知识。 看到网上关于AdaBoost和GBDT资料都不少,可是鲜有资料介绍他们联系,刚好之前有看过,最近...

2295
来自专栏机器学习算法与Python学习

深度学习CNN发展大事件一览

深度学习(DeepLearning)尤其是卷积神经网络(CNN)作为近几年来模式识别中的研究重点,受到人们越来越多的关注,相关的参考文献也是层出不穷,连续几年都...

1310
来自专栏华章科技

深度学习卷积神经网络大事件一览

导读: 深度学习(DeepLearning)尤其是卷积神经网络(CNN)作为近几年来模式识别中的研究重点,受到人们越来越多的关注,相关的参考文献也是层出不穷,连...

1042

扫码关注云+社区