但是对于生成问题,却没有这样红利。在深度学习出现之初,生成问题几乎是止步不前的。原因为——生成模型是一个无中生有的模型,没有一个具体的标准来判别说这个生成的结果到底是好还是不好,比如说图像风格转换就是一个这样的问题。又比如说漫画上色也是这样一个问题,就算上了色也无法判断这个模型的好坏。又比如图像生成文本,我们也很难有一个指标去判断好坏。因为这些问题的特点,我们无法利用判别模型的诸多技术。
根据一些指标显示,关于生成对抗网络(GAN)的研究在过去两年间取得了本质的进步。在图像合成模型实践中的进步快到几乎无法跟上。
选自arXiv 作者:Mahmood Sharif等 机器之心编译 参与:Panda 生成对抗网络(GAN)已经是人工智能领域内的一个常用词了,但你听说过对抗生成网络(AGN)吗?近日,卡内基梅隆大学和北卡罗来纳大学教堂山分校的研究者在 arXiv 上发布的一篇论文提出了这种网络,可实现对当前最佳的人脸识别模型的神经网络攻击。 深度神经网络(DNN)已经在人脸验证(即确定两张人脸图像是否属于同一个人)方面超越了人类的水平。不幸的是,研究还表明使用对抗样本(adversarial example)就可以轻易
📷 ---- 新智元编译 来源:github 作者:Junho Kim 编译:肖琴 【新智元导读】StarGAN 是去年 11 月由中国香港科技大学、新泽西大学和韩国大学等机构的研究人员提出的一个图像风格迁移模型,是一种可以在同一个模型中进行多个图像领域之间的风格转换的对抗生成方法。近日,有研究人员将 StarGAN 在 TensorFlow 上实现的全部代码开源,相关论文获 CVPR 2018 Oral。 开源地址:https://github.com/taki011
【新智元导读】今日 arXiv 最火论文之一,作者包括著名的《深度学习》(Deep Learning)一书的作者 Aaron Courville。论文用 GAN 解决自然语言处理问题,“在中国诗词数据集上取得目前最好结果”。研究人员表示,他们为训练 GAN 生成自然语言提供了一种直接有效的方法。作者表示,接下来他们想探索 GAN 在 NLP 其他领域的应用,比如非目标导向的对话系统。 对抗生成网络(GAN)是眼下的热词,而使用 GAN 做自然语言处理(NLP)则一直是业界关注的问题。日前,包括“Deep L
【新智元导读】康奈尔大学研究员结合贝叶斯和对抗生成网络,在6大公开基准数据集上实现了半监督学习的最佳性能,同时,这也是迈向终极无监督式学习的一大步。研究提出了一个实用的贝叶斯公式,用GAN来进行无监督学习和半监督式学习。这种新提出的方法,简洁性是其最大的优势——推理是直接进行的、可解释的、稳定的。所有的实验结果的获得,都不需要参数匹配,正则化或者任何的特别(ad-hoc)技巧。 康奈尔大学的 Andrew Gordon Wilson 和 Permutation Venture 的 Yunus Saatch
腾讯旗下顶级视觉研发平台腾讯优图,官宣有13篇论文入选,居业界实验室前列,其中3篇被选做口头报告(Oral),该类论文占总投稿数的4.3%(200/4323)。
两年一度的国际计算机视觉大会 (International Conference on Computer Vision,ICCV) 将于 2019 年 10 月 27 日 - 11 月 2 日在韩国首尔举行,近日论文收录名单揭晓,腾讯优图共有13篇论文入选,居业界实验室前列,其中3篇被选做口头报告(Oral),该类论文仅占总投稿数的4.3%(200/4323)。
【导读】当地时间 10月 22 日到10月29日,两年一度的计算机视觉国际顶级会议 International Conference on Computer Vision(ICCV 2017)在意大利威尼斯开幕。Google Brain 研究科学家 Ian Goodfellow 在会上作为主题为《生成对抗网络(Generative Adversarial Networks)》的Tutorial 最新演讲, 介绍了GAN的原理和最新的应用。为此,专知内容组整理了的Goodfellow的slides,进行了解读
AI科技评论消息,由多伦多大学与蒙特利尔大学的Karan Grewal、R Devon Hjelm、Yoshua Bengio三人近日合作发表的文章《Variance Regularizing Adversarial Learning》提出了一种方差正则化对抗学习方法(Variance Regularizing Adversarial Learning, VGAL)。相比以往的对抗生成网络(GAN),VGAL 可以使鉴别器具有更加平滑输出分布特性,并且在真样本分布与生成样本分布间设定一定的混叠区间,从而提升
AAAI 2020 已经在纽约步入最后一天,然而还有许多优秀工作未能分享给关注AI 前沿研究的读者。AI科技评论在接下来的时间里将快马加鞭,努力工作。
选自WordPress 作者:Alexia Jolicoeur-Martineau 机器之心编译 参与:李泽南 生成对抗生成网络(GAN)被认为是近年来机器学习界的一大发现,在它的基础上开发各种新算法是很多科研人员努力的方向。近日,毕业于魁北克大学的 Alexia Jolicoeur-Martineau 开始尝试使用猫咪图片来训练不同的对抗生成网络,并把代码和结果公开。目前他已经测试了四种不同 GAN 的效果,Meow Generator 引起了众多学者的兴趣。有人打趣地评论道:由于网络中存在大量猫图,这种
【新智元导读】一篇在 ArXiv 上非常火的文章《自然语言对抗生成》引发了 Yann LeCun 和 Yoav Goldberg 的激烈论战。Yoav Goldberg 措辞激烈:“拜托你们这帮搞深度学习的人,别再抓着语言不放并声称自己已经解决语言的问题了!” Yann LeCun 则一脸惊愕:“这言论居然来自 Yoav ?他自己也在从事将深度学习应用于 NLP 的研究啊!”二人的论战,更直接涉及了 ArXiv 的模式及所谓的“占坑现象”。同时,也凸显了 NLP 领域语言学家和计算机科学家那暂且平息却远未消
像素到像素的预测 每次写一篇都为了自己更深的思考,也希望大家能读懂,一丢丢都不难。这篇论文解决的问题是使用通用框架解决像素到像素的预测,按照从上到下,从做到右说明:上图的第一幅分割街景图恢复成真是街景图,第二幅使用不同颜色的块生成真实建筑,第三幅图是常见的灰度变彩色,第四幅是将空中照片生成地图(谷歌地图),第五幅是图片的风格转移,第六幅图是通过简单的草图生成真实物体。综上,这些任务都是将一张输入图片翻译成另一张
本文介绍的是 ACL 2020 论文《A Reinforced Generation of Adversarial Examples for Neural Machine Translation》,论文作者来自南京大学、腾讯。
随后,就是电影《上甘岭》的女主角玉兰上场,虽然看上去未施粉黛,但一点不逊色于今天的女明星~
我们简单的说所有模型应用都是给定一个输入,训练产生一个label输出。从直接对一个图片的分类到句子生成(这也是一个分类问题,我们的label是在词空间中,我们会去逐个学习来产生多词label)
【新智元导读】pix2pix 又有更新:悉尼大学的 Chaoyue Wang 等人受生成对抗网络(GAN)启发,在已有的感知损失基础上,提出了感知对抗网络(Perceptual Adversarial Network,PAN),能够持续地自动发现输出与真实图像间的差异,进一步提高图像转换的性能。在几种不同的图像转变任务中,PAN 的性能都超越了当前最优模型。 近来,卷积神经网络的发展,结合对抗生成网络(GAN)等崭新的方法,为图像转换任务带来了很大的提升,包括图像超分辨率、去噪、语义分割,还有“自动补全”,
《Learning Shape Priors for Single-View 3D Completion and Reconstruction 》。再此分享给大家。同时也抛砖引玉吸引大家能够积极参与分享中。
2020 IEEE国际计算机视觉与模式识别会议(IEEE Conference on Computer Vision and Pattern Recognition,简称CVPR)公布接收论文结果。清华大学计算机系“类脑计算与认知”团队提交的论文《Reusing Discriminators for Encoding Towards UnsupervisedImage-to-Image Translation》被成功接收。论文第一作者为陈润发,是清华大学计算机系硕士二年级研究生;指导老师为孙富春教授(中国人工智能学会副理事长,清华大学教授,IEEE/CAAI Fellow)等。
今日介绍10篇论文,来自腾讯旗下视觉研发平台腾讯优图,涉及数学速算批改、视频识别、语义分割等技术领域,跨越识别、交通、教育和医疗等场景,是腾讯优图最新研发成果。
随着深度学习的发展,研究者们希望深度学习模型不但可以从特定领域训练集中学习监督知识,更希望能够进行领域自适应(domain adaptation)和知识迁移技术(knowledge transfer techniques),将在一个领域数据集中学习的知识迁移到新的领域中。那么能否同时利用多个不同领域的训练样本,提高在新领域上的语义理解能力呢?
最近几年安全界关于对抗学习的研究如火如荼,对抗样本的生成技术发展迅速。使用不同的对抗攻击方法可以生成对抗样本,不同攻击方法的攻击效果也有所不同。 另外关于对抗样本攻击的防御方法,已经有不少学者提出了一些解决方案,不过防御效果上还有提升空间。下图是关于对抗学习经典的应用场景,攻击者利用对抗样本攻击方法对关于熊猫的图片进行微小的修改从而使深度学习图像识别模型失效,误以为图片中的是长臂猿。这种攻击手段已经在本文之前已经进行过讨论。
本文解读的是ECCV 2020 Oral论文《Exploiting Deep Generative Prior for Versatile Image Restoration and Manipulation》,本文提出一种挖掘预训练的对抗生成网络(GAN)中图像先验的方法,无需针对特定任务设计,便可实现种图像复原(上色,补全,超分辨率,对抗防御)和图像编辑(随机扰动,图像变形,类别转换)效果。
【新智元导读】谷歌研究院官方博客几小时前更新文章,介绍了一种名为“缩放卷积神经网络”的新方法,能够解决在使用反卷积神经网络生成图像时,图片中尤其是深色部分常出现的“棋盘格子状伪影”(棋盘效应,checkboard artifacts)。作者讨论了棋盘效应出现及反卷积难以避免棋盘效应的原因,并提供了缩放卷积 TensorFlow 实现的代码。作者还表示,特意提前单独公开这一技术,是因为这个问题值得更多讨论,也包含了多篇论文的成果,让我们谷歌大脑的后续大招吧。 当我们非常仔细地观察神经网络生成的图像时,经常会看
本次报道论文为发表于PNAS的Understanding the role of individual units in a deep neural network。众所周知,深度神经网络擅长查找可解决大型数据集上负责任务的分层表示。人类如何理解这些学习到的表示,这是值得探究的问题。该文章是美国麻省理工学院的David Bau博士等人在该领域的研究成果:首先提出网络剖析方法来识别、可视化和量化深度神经网络中各个神经元的作用,接着剖析了在图像分类和图像生成两种不同类型的任务上训练的网络神经元,最后通过两个应用程序证明了方法的有用性。
【新智元导读】“生成对抗网络是切片面包发明以来最令人激动的事情!”LeCun前不久在Quroa答问时毫不加掩饰对生成对抗网络的喜爱,他认为这是深度学习近期最值得期待、也最有可能取得突破的领域。生成对抗学习是无监督学习的一种,该理论由 Ian Goodfellow 提出,此人现在 OpenAI 工作。作为业内公认进行前沿基础理论研究的机构,OpenAI 不久前在博客中总结了他们的5大项目成果,结合丰富实例介绍了生成对抗网络,并对OpenAI 五大落地项目进行梳理,包括完善对抗生成网络(GAN)、完善变分推断(
图像分割是图像处理和计算机视觉中的重要话题,其应用主要为场景理解、医学图像分析、机器人感知、视频监控、增强现实和图像压缩等。目前已经存在了很多用于图像分割的算法。由于最近深度学习模型广泛应用于视觉任务中,并取得成功,因此有大量工作旨在用深度学习模型开发图像分割方法。在本文中,对相关文献进行了全面回顾,涵盖了语义级和实例级分割的各种方法,包括全卷积像素标记网络、编码器-解码器体系结构、多尺度以及基于金字塔的方法、递归网络和视觉注意模型以及对抗生成网络。与此同时,研究了这些深度学习模型的相似性、优势和挑战,以及使用最广泛的数据集和方法性能,并讨论了该领域有希望的未来研究方向。
在一些社交媒体平台,每次你上传照片或视频时,它的人脸识别系统会试图从这些照片和视频中得到更多信息。比如,这些算法会提取关于你是谁、你的位置以及你认识的其他人的数据,并且,这些算法在不断改进。
半个月前,Yann LeCun要来清华演讲的消息在国内AI圈一经传开,各位AI界人士便坐不住了。作为Facebook人工智能研究院院长、纽约大学终身教授、卷积神经网络之父,LeCun已然成为了AI人心目中的男神。 演讲当天(3月22日),AI科技评论也来到了LeCun的演讲现场。演讲开始前,只见许多想要听演讲,却无奈没有得到票的同学,焦急地坚守在演讲大厅门前,希望能一睹男神风采,或运气爆棚能偶得一票。一个专业性质极强的学术演讲能吸引这么多人来参加,也再一次体现了Yann LeCun的个人魅力和在AI界的
简单来讲,变分自编码器是可以和GAN相媲美的生成网络。我们可以输入一个低维空间的Z,映射到高维空间的真实数据。比如,生成不同样的数字,人脸等等。
近日,商汤-港中文联合实验室提出基于风格化对抗生成器的人脸渲染器,用于取代传统图形学基于栅格化的渲染器来进行3D模型的重建。该方法构建了一种从输入3D模型到生成图像的平滑梯度,同时可以以低精度建模获得渲染更高质量的图像。与此同时,通过对生成网络式的渲染器反向传播算法,能够获得更具有图像细节特征的重建人脸3D模型。
2014年Ian Goodfellow首次提出Generative adversarial networks (生成对抗网络)简称GANs,生成对抗网络就开始在计算机视觉领域得到广泛应用,成为对有用的视觉任务网络之一,也是如今计算机视觉热点研究领域之一,其已经出现的应用领域与方向如下:
新智元报道 来源:eurekalert.org 编辑:肖琴 【新智元导读】多伦多大学研究人员设计新算法,通过动态地干扰人脸识别工具来保护用户的隐私。结果表明,他们的系统可以将原本可检测到的人脸比例
【新智元导读】Ian Goodfellow刚刚在Twitter盛赞一篇论文,担心仅仅浏览摘要无法充分体会其突破。这篇正在ICLR-18双盲审核中的论文,提出了一种叫做“谱归一化”的新的权重归一化方法,
【导读】CMU博士杨植麟与导师同时也是苹果首任AI总监Ruslan Salakhutdinov 在NIPS2017上合作提出新的GAN生成模型,大幅度提高对抗生成网络的特征匹配能力,论文代码也于近日在
场景描述:复建历史建筑与文物的工作常常需要历时数年,利用 3D 建模、卷积神经网络、对抗生成网络等人工智能技术,能够为重建、修复工作提供指导与参考建议。
近些年来,随着深度学习和对抗生成网络的兴起,图像生成领域取得了巨大的进步。然而,对于计算机视觉领域的生成问题,并非只有生成对抗网络这样唯一的解决途径。在SFFAI22我的演讲中,我们将以两篇工作为例,介绍常见的生成模型,以及对于生成模型中的不同问题我们的解决方案:
---- 点击上方↑↑↑“OpenCV学堂”关注我来源:公众号 新智元 授权 【导读】人脸识别技术最近又有新的破解方式!一位斯坦福的学生使用GAN模型生成了几张自己的图片,轻松攻破两个约会软件,最离谱的是「女扮男装」都识别不出来。 真的有人能模仿你的脸,还绕开了人脸识别系统! 最近斯坦福大学的研究人员在arxiv上发布了一篇论文,虽说是斯坦福CS236G的课程作业,不过论文中提出了一个非常有趣的思路,用对抗生成网络GAN生成一个面部图像来模仿目标人脸,看看人脸识别系统能否正确验证。 因为人脸的关键特征信
---- 新智元报道 编辑:LRS 【新智元导读】人脸识别技术最近又有新的破解方式!一位斯坦福的学生使用GAN模型生成了几张自己的图片,轻松攻破两个约会软件,最离谱的是「女扮男装」都识别不出来。 真的有人能模仿你的脸,还绕开了人脸识别系统! 最近斯坦福大学的研究人员在arxiv上发布了一篇论文,虽说是斯坦福CS236G的课程作业,不过论文中提出了一个非常有趣的思路,用对抗生成网络GAN生成一个面部图像来模仿目标人脸,看看人脸识别系统能否正确验证。 因为人脸的关键特征信息都保留了下来,所以论文的结果
中科院自动化所(CASIA),中科院大学和南昌大学的一项合作研究,提出了双路径 GAN(TP-GAN),通过单一侧面照片合成正面人脸图像,取得了当前较好的结果。研究人员提出了一个像人类一样能够考虑整体和局部信息的 GAN 结构,合成的图像非常逼真且很好地保留了身份特征,并且可以处理大量不同姿势的照片。研究人员指出,这些合成的图像有可能用于人脸分析的任务。 他们受人类视觉识别过程启发,结合对抗生成网络(GAN)的强大性能,提出了一个双路径 GAN(TP-GAN),能够在关注整体结构的同时,处理人脸面部细节,在
风格迁移指的是两个不同域中图像的转换,具体来说就是提供一张风格图像,将任意一张图像转化为这个风格,并尽可能保留原图像的内容(否则就成了艺术创作了…)
点击蓝字 关注我们 大家好,欢迎来到《不写代码也能看懂的风控安全系列》。 今天开启的“验证码风云录”专题将围绕一个课题展开,即探秘:“验证码为什么越做越简单了?” 在这一系列中,笔者将验证码的20年发展历程大致分为3大阶段: · 比谁更丑 → 图像对抗时代 → 本文揭秘 · 比谁更精 → 行为对抗时代 → 下篇预告 · 比谁更深 → 资源对抗时代 → 前沿报告 而本文将要带大家走近的,便是“比比谁更丑”的图像对抗时代。 全文4000字,阅读预计15分钟,喜欢你就赞我一下! 01 #前言:为什么会有
Google Research的研究科学家Jordi Pont-Tuset做了一个统计,根据论文题目,看深度学习的发展趋势。结果,他发现生成对抗网络(GAN)强势出击,大有取代“深度学习”(Deep Learning)之势。 可是GAN是生成模型的一种,实际上 GAN 能做的事情,很多其他生成模型也能做,如果GAN的训练能稳定下来,甚至像深度学习那么可靠,那么GAN就能真正发展起来。如果不能,那么GAN 将会被其他方法所取代。他有大约 40% 的时间都用在稳定 GAN 上面。 其实除了图像生成,GAN的
本文与你讨论蒙日-安培方程正则性理论关于GAN模型中模式崩溃(Mode Collapse)的解释。
欢迎来到《每周CV论文推荐》。在这个专栏里,还是本着有三AI一贯的原则,专注于让大家能够系统性完成学习,所以我们推荐的文章也必定是同一主题的。
MIT 利用图神经网络 Chemprop 识别潜在抗生素,特异性杀死鲍曼不动杆菌。
CycleGAN tensorflow PyTorch by LynnHo,一个简单的 TensorFlow 实现
减小源域和目标域之间的域间差异,使得使用源域的图片和Label训练的分割模型可以用于目标域的分割。
领取专属 10元无门槛券
手把手带您无忧上云