专栏首页人工智能前沿讲习CCAI 2020 | 耿新—经典论文工作推荐

CCAI 2020 | 耿新—经典论文工作推荐

CCAI

2020年8月29日-30日

2020年中国人工智能大会(Chinese Congress on Artificial Intelligence 2020,简称“CCAI 2020”)将于8月29日-30日在南京召开。CCAI 2020以“智周万物”为主题,探讨人工智能作为引领未来的战略性技术,如何以周知万物的学术境界赋能未来,带动时代发展,实现互联世界的远大理想。

东南大学计算机学院、软件学院院长、人工智能学院执行院长,国家优青,IETI Distinguished Fellow耿新将出席本次大会并担任《青年科学家专题论坛》论坛主席。

耿新:分别于2001年和2004年在南京大学计算机科学与技术系获得学士和硕士学位,于2008年获得澳大利亚Deakin大学博士学位。创建东南大学模式学习与挖掘(PALM)实验室并担任实验室主任至今。目前主要从事机器学习、模式识别、计算机视觉等方面的研究。曾获国家级教学成果奖一等奖、教育部自然科学奖一等奖等多项教学、科研奖励,入选国际工程与技术学会(IETI)杰出会士。曾获国家优秀青年科学基金、江苏省杰出青年科学基金资助,主持国家重点研发计划课题、国家自然科学基金等多个科研项目。

01

Partial Multi-Label Learning with Label Distribution

论文地址:

http://palm.seu.edu.cn/xgeng/files/aaai20.pdf

介绍:部分多标签学习(PML)旨在从训练示例中学习,每个训练示例都与一组候选标签相关联,其中只有一个子集对训练示例有效。推导预测模型的常见策略是尝试消除候选标签集的歧义,例如通过利用每个候选标签的置信度来识别真值标签或估计候选标签集中的噪声标签。尽管如此,这些策略忽略了考虑与每个实例相对应的基本标签分布,因为标签分布在训练集中未明确可用。本文提出了一种新的部分多标签学习策略,称为PML-LD,以通过标签增强从部分多标签示例中学习。具体来说,通过利用特征空间的拓扑信息和标签之间的相关性来恢复标签分布。之后,通过使用恢复的标签分布拟合正则化的多输出回归变量来学习多类预测模型。在合成数据集和实际数据集上的实验结果清楚地证明了PML-LD解决PML问题的有效性。

02

Multi-Person Pose Estimation with Enhanced Channel-wise and Spatial Information

论文地址:

http://palm.seu.edu.cn/xgeng/files/cvpr19.pdf

介绍:多人姿势估计是计算机视觉中一个重要但具有挑战性的问题。尽管当前的方法通过融合多尺度特征图取得了显著进展,但它们很少关注增强特征图的通道和空间信息。在本文中,我们提出了两个新颖的模块来执行多人姿势估计信息的增强。首先,提出了信道混洗模块(CSM),对不同层次的特征图采用信道混洗操作,促进了金字塔特征图之间的跨信道信息通信。其次,设计了空间-通道注意力残余瓶颈(SCARB),以通过注意力机制增强原始残余单元,在空间和通道方式中自适应突出显示特征图的信息。我们提出的模块的有效性在COCO关键点基准上进行了评估,实验结果表明,我们的方法达到了最先进的效果。

03

Label Distribution Learning on Auxiliary Label Space Graphs for Facial Expression Recognition

论文地址:

http://palm.seu.edu.cn/xgeng/files/cvpr20.pdf

介绍:现有的许多研究表明,注释不一致在各种面部表情识别(FER)数据集中广泛存在。原因可能是人类注释者的主观性和表情标签的含糊性质。解决这一问题的一种有前途的策略是最近提出的称为标签分布学习(LDL)的学习范式,该范式允许将具有不同强度的多个标签链接到一个表情。但是,直接应用标签分布学习通常是不切实际的,因为许多现有数据集仅包含一个独热标签,而不包含标签分布。为了解决该问题,我们提出了一种名为“在辅助标签空间图上进行标签分布学习”(LDL-ALSG)的新颖方法,该方法利用了来自相关但更独特的任务(例如动作单元识别和面部标志检测)的标签拓扑信息。基本假设是面部图像在动作单元识别和面部标志检测的标签空间中应具有与其邻居相似的表情分布。我们提出的方法在各种数据集上得到了评估,并且始终以极大的优势胜过那些最先进的方法。

04

Practical Age Estimation Using Deep Label Distribution Learning

论文地址:

http://palm.seu.edu.cn/xgeng/files/FCS20.pdf

介绍:年龄估计在人机交互系统中起着重要作用。缺乏大量的具有确定年龄标签的面部图像使得年龄估计算法效率低下。事实证明,采用卷积神经网络(CNN)和标签分布学习来从真实年龄和邻近年龄学习歧义的深度分布学习(DLDL)优于当前的最新框架。但是,DLDL假定标签分布很粗糙,涵盖了任何给定年龄标签的所有年龄。在本文中提出了一种更实用的标签分配范式:我们限制年龄标签分配,使其仅涵盖合理数量的相邻年龄。此外,我们探索了不同的标签分布,以提高提出的学习模型的性能。我们采用CNN和改进的标签分配学习方法来估算年龄。实验结果表明,与DLDL相比,我们的方法对面部年龄识别更为有效。

05

Discrete Binary Coding based Label Distribution Learning

论文地址:

http://palm.seu.edu.cn/xgeng/files/ijcai19b.pdf

介绍:标签分发学习(LDL)是机器学习中的一种通用学习范式,其特殊情况包括单标签学习(SLL)和多标签学习(MLL)。最近,已经提出了许多LDL算法来处理不同的应用任务,例如面部年龄估计、头部姿势估计和视觉情绪分布预测。但是,大多数现有LDL算法的训练时间复杂度过高,这使其不适用于大规模LDL。在本文中,我们提出了一种新颖的LDL方法来解决此问题,称为基于离散二进制编码的标签分发学习(DBC-LDL)。具体来说,我们设计了一个有效的离散编码框架来学习实例的二进制代码。此外,成对语义相似性和原始标签分布都集成到此框架中,以学习具有高度区分性的二进制代码。另外,快速近似最近邻(ANN)搜索策略用于预测测试实例的标签分布。在五个真实数据集上的实验结果表明,它具有比几种最新的LDL方法优越的性能,且具有较低的时间成本。

本文分享自微信公众号 - 人工智能前沿讲习(AIFrontier)

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2020-08-13

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • GMNN: Graph Markov Neural Networks

    我们生活在一个互联的世界中,实体通过各种关系相互联系。例如,网页通过超链接相互关联,社交媒体用户通过社交关系相互关联。对这种关系数据建模是机器学习中的一个重要的...

    马上科普尚尚
  • SFFAI分享 | 田正坤 :Seq2Seq模型在语音识别中的应用

    随着神经机器翻译的兴起,基于Attention的Seq2Seq模型由于其强大的建模变长序列直接转换问题的能力,也在其他领域获得了极大的关注。语音识别问题本质上也...

    马上科普尚尚
  • 精选论文 | 机器翻译专场之同步双向与多语言机器翻译【附打包下载】

    机器翻译一直是自然语言处理中的重要研究任务,而最近的几个月自然语言处理领域尤其在文本生成、机器翻译领域又有新的突破不断提出!今天的两位讲者,一位讲者将分享双向同...

    马上科普尚尚
  • 前端-HTML-web服务本质-HTTP协议-请求-标签-01(待完善)

    我们的浏览器端(B/S架构)本质上也是一个客户端,通过socket与服务端通信,发送请求,获得返回数据,再有浏览器将服务器返回的数据渲染成页面上看到的一个一个标...

    suwanbin
  • html+css学习笔记003-样式初始化

    Mr. 柳上原
  • HTML标签分类

    在HTML页面中,带有“<>”符号的元素被称为HTML标签,如 <HTML>、<head>、<body>、<head>等都是HTML骨架结构标签。所谓标签就是放...

    爱知汇
  • 用户画像实践:神策标签生产引擎架构

    导读:用户画像是建立在数据基础之上的用户模型,是产品改进、精准营销等业务场景中不可或缺的重要基础。而构建用户画像的过程就是要给用户打上各种维度的标签,并基于标签...

    木东居士
  • vim-tabe多标签切换

    原文链接:https://www.cnblogs.com/liqiu/archive/2013/03/26/29819...

    ccf19881030
  • 如何有效推进百万标签库的治理?

    在大多数公司,成千上万的标签虽然在某种程度上是数据服务能力的象征,但到最后往往成为了一种负担,只管杀不管埋的现象太普遍了!

    木东居士
  • HTML知识清单(附学习网站)

    上面知识点知识本人总结的,想要深入学习的话请跳转至http://www.w3school.com.cn/专业的前段技术学习网站,免费开源!!!

    时间静止不是简史

扫码关注云+社区

领取腾讯云代金券