2018年PaddlePaddle经典论文复现合集

过去几年发表于各大 AI 顶会论文提出的 400 多种算法中,公开算法代码的仅占 6%,其中三分之一的论文作者分享了测试数据,约 54% 的分享包含“伪代码”。这是今年 AAAI 会议上一个严峻的报告。 人工智能这个蓬勃发展的领域正面临着实验重现的危机,就像实验重现问题过去十年来一直困扰着心理学、医学以及其他领域一样。最根本的问题是研究人员通常不共享他们的源代码。

可验证的知识是科学的基础,它事关理解。随着人工智能领域的发展,打破不可复现性将是必要的。为此,PaperWeekly 联手百度 PaddlePaddle 共同发起了论文复现活动,希望和来自学界、工业界的研究者一起接力,为 AI 行业带来良性循环。

2018年的这一次论文复现活动,我们收获了5份高质量作品,在假期即将到来之际,和大家一起重温。

2019年,我们将继续鼓励开发者们复现经典论文,促进AI行业的良性循环。

论文复现文章链接及简介:

PyraNet(2篇)

Learning Feature Pyramids for Human Pose Estimation是发表在 ICCV 2017 的工作,论文提出了一个新的特征金字塔模块,在卷积网络中学习特征金字塔,并修正了现有的网络参数初始方法,在人体姿态估计和图像分类中都取得了很好的效果。

[链接]

作者丨Dicint

学校丨北京信息科技大学

研究方向丨分割、推荐

作者丨黄泽宇

学校丨深圳大学

研究方向丨计算机图形学、深度学习

图像超分辨率重建

单图像超分辨率重构(SR)可以从一张较小的图像生成一张高分辨率的图像。显然,这种恢复的结果是不唯一的。可以这样直观地理解:远远看到一个模糊的身影,看不清脸,既可以认为对面走来的是个男生,也可以认为这是个女生。那么,当我想象对面人的长相时,会如何脑补呢?

这就依赖于我们的先验知识。假如我认为,一个穿着裙子的人肯定是个女生,而对面那个人穿着裙子,所以我认为那是个女生,脑补了一张女神脸。然而,如果我知道穿裙子的人不一定是女生,还可能是女装大佬。迎面走来那个人瘦瘦高高,所以我认为十有八九是个男孩子,就会脑补一个……

也就是说,不同的先验知识,会指向不同的结果。我们的任务,就是学习这些先验知识。目前效果最好的办法都是基于样本的(example-based)。

[链接]

作者丨Molly

学校丨北京航天航空大学

研究方向丨计算机视觉

LSGAN

近几年来 GAN 是十分火热的,由 Goodfellow 在 14 年发表论文Generative Adversarial Nets[1]开山之作以来,生成式对抗网络一直都备受机器学习领域的关注,这种两人零和博弈的思想十分有趣,充分体现了数学的美感。从 GAN 到WGAN[2]的优化,再到本文介绍的 LSGANs,再到最近很火的BigGAN[3],可以说生成式对抗网络的魅力无穷,而且它的用处也是非常奇妙,如今还被用在例如无负样本的情况下如何训练分类器,例如AnoGAN[4]。

LSGANs 这篇经典的论文主要工作是把交叉熵损失函数换做了最小二乘损失函数,这样做作者认为改善了传统 GAN 的两个问题,即传统 GAN 生成的图片质量不高,而且训练过程十分不稳定。

[链接]

作者丨文永亮

学校丨华南理工大学

研究方向丨目标检测、图像生成

InfoGAN

生成对抗网络(Generative Adversarial Nets)是一类新兴的生成模型,由两部分组成:一部分是判别模型(discriminator)D(·),用来判别输入数据是真实数据还是生成出来的数据;另一部分是是生成模型(generator)G(·),由输入的噪声生成目标数据。

然而当我们遇到存在潜在的类别差别而没有标签数据,要使 GAN 能够在这类数据上拥有更好表现,我们就需要一类能够无监督地辨别出这类潜在标签的数据,InfoGAN 就给出了一个较好的解决方案。

[链接]

作者丨黄涛

学校丨中山大学数学学院18级本科生

研究方向丨图像识别、VQA、生成模型和自编码器

-END-

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20190203B0DUGS00?refer=cp_1026
  • 腾讯「云+社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 yunjia_community@tencent.com 删除。

扫码关注云+社区

领取腾讯云代金券