前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
社区首页 >专栏 >雷布斯变猫布斯,皮卡丘变狗卡丘:英伟达最新AI开源,万物换脸只凭一张图 | Demo

雷布斯变猫布斯,皮卡丘变狗卡丘:英伟达最新AI开源,万物换脸只凭一张图 | Demo

作者头像
量子位
发布于 2019-05-16 08:14:18
发布于 2019-05-16 08:14:18
5440
举报
文章被收录于专栏:量子位量子位
圆栗子 发自 凹非寺 量子位 报道 | 公众号 QbitAI

英伟达家的新AI,可以把视频里的一只金毛,迅速变成猫鼬。

只要给AI看两张猫鼬的静态图:

在看到这两张图之前,AI从来没有见过猫鼬这种动物,训练集里没有。

AI没见过的动物还有很多,只要给它一两张照片熟悉一下,就可以把金毛换成它们的脸。

比如,凶猛的大型猫科动物:

这样说来,金毛的亲戚如哈士奇等辈,更加不在话下:

虽说同是图到图的翻译,同是无监督,这只AI和马变斑马的前辈非常不同。前辈只能在自己见过的动物之间做翻译。训练的时候,看过许多马,也看过许多斑马;

而英伟达的新选手,相当于训练中从没见过斑马。训练集里没有的动物,只要测试的时候能看到一两张图,就够了。

小样本学习 (Few-Shot Learning) 算法,对训练数据的要求大大大大大大降低了。

团队把算法开源了,还上线了一键换脸Demo。所以,今天先玩耍一下再讲原理。

错误与正确的打开方式

在下鸡冻地尝试了Demo

第一题,把一只高冷的喵传了上去,用方框选中头部。

鸣谢我司夏老司

于是,各种动物都获得了半侧面的冷峻

第二题,把一只雷布斯传了上去,也是半侧面:

意想不到,生成了贵族气息的半兽人

AI的艺术天分扑面而来,不过还是要郑重提醒各位:

Demo应用叫做宠物换脸 (PetSwap) ,请选择正确的打开方式,下面是正确示范。

第三题,冲破次元壁。去吧,大侦探皮卡丘:

大家都戴上了福尔摩斯的帽子,不过只有右上角的猎犬,解锁了性感的腮红

真是一个优雅又充实的早晨。

玩够,该看原理了。

没见过的动物,只要看一眼

就像开头讲到的,这是一个小样本翻译器。它要把内容图 (Content Image) 如金毛,换成类别图 (Class Image) ,如哈士奇或者美洲狮

模型分为三个部分:

一是内容编码器 (Content Encoder) ,粉色部分。它把输入的内容图 (金毛) ,映射到一个内容潜码 (Content Latent Code) 上。 二是类别编码器 (Class Encoder) ,绿色部分。先把每张类别图 (哈士奇) 映射到一个潜码上。然后取个平均,就得到整个类别的潜码了。 三是解码器 (Decoder) ,蓝色部分。先把类别潜码映射到adaIN参数上,然后把内容潜码做个解码,来生成翻译的结果图。

训练的时候,数据集里有金毛也有哈士奇。AI就在这些见过的类别之间,修炼换脸技能:

可是,训练集里没有美洲狮。测试的时候,要生成美洲狮怎么办呢?

秘密就在这里:当类别图和内容图长得一样的时候,就让模型生成一个重构 (Reconstruction) 。

这样,只要在测试的过程中,临时看一张美洲狮 (或者几张) ,就能把没见过的瞬间变为见过的。AI把训练集里的狗,翻译美洲狮,也就不难了:

大功告成。

你也快去玩啊

这样 (优) 秀的AI,你一定也想调教一下。

代码、Demo、论文,都在这里了:

Demo传送门: https://nvlabs.github.io/FUNIT/petswap.html

论文传送门: https://arxiv.org/abs/1905.01723

代码传送门: https://github.com/nvlabs/FUNIT/

主页传送门: https://nvlabs.github.io/FUNIT/

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2019-05-10,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 量子位 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
C++信奥教学PPT:CSP_J_算法之双指针算法(中)
1、⼀个⻓度为 n-1 的递增排序数组中的所有数字都是唯⼀的,并且每个数字都在范围0~n-1 之内。在范围 0~ n-1 内的 n 个数字中有且只有⼀个数字不在该数组中,请找出这个数字。
一枚大果壳
2024/04/18
1210
C++信奥教学PPT:CSP_J_算法之双指针算法(中)
【GEE】4、 Google 地球引擎中的数据导入和导出
了解动物对环境的反应对于了解如何管理这些物种至关重要。虽然动物被迫做出选择以满足其基本需求,但它们的选择很可能也受到当地天气条件等动态因素的影响。除了直接观察之外,很难将动物行为与天气条件联系起来。在这个单元中,我们将从美洲狮收集的 GPS 项圈数据与通过 GEE 访问的 Daymet 气候数据集的每日温度估计值集成。
Twcat_tree
2023/11/07
1.2K0
【GEE】4、 Google 地球引擎中的数据导入和导出
Debug图像分类模型:为什么模型会在生产环境中失效?
来源:AI公园本文约1000字,建议阅读5分钟本文讨论模型在生产中失效的一些常见模式。 计算机视觉模型在训练、验证和测试集中可以正常工作,但在生产场景中失效。 错误模式1:变体分类器(观察到了错误的地方) 模型预测了环境等虚假特征,而不是感兴趣的对象。例如,让我们看下面的示例,用预训练模型VGG16对图像的预测。这些图像是美洲狮和一些飞行昆虫的图像。虽然VGG16能够准确地预测美洲狮,但它在预测飞行昆虫身上失效了。从热图中可以看出,VGG16很好地聚焦了不变特征,即动物的身体。但是它没有聚焦在昆虫的身体上,
数据派THU
2023/04/12
2500
Debug图像分类模型:为什么模型会在生产环境中失效?
NeurIPS 2024高中赛道开卷!人大附中、北师大实验中学等摘得3篇Spotlight
今年,NeurIPS 2024首次设置了「高中生赛道」,直接将「学好AI要从娃娃抓起」变成了现实。
新智元
2025/02/14
600
NeurIPS 2024高中赛道开卷!人大附中、北师大实验中学等摘得3篇Spotlight
10分钟了解图嵌入
去年,图嵌入在企业知识图谱(EKG)策略中变得越来越重要。图形嵌入将很快成为在大型十亿顶点EKG中快速找到相似项目的实际方法。实时相似性计算对于许多领域至关重要,例如推荐,最佳行动和队列构建。
deephub
2020/12/11
4910
10分钟了解图嵌入
macOS X 20周年诞辰,乔布斯的设计理念仍在引导macOS 11
在 2001 年 3 月 24 日,苹果推出了Mac OS X v10.0(内部代号为猎豹),从此拉开了长达19年多统治的一代macOS 10系统,直到2020年6月22日推出新一代 macOS Big Sur。
新智元
2021/04/14
9420
【漫画】分享16张程序员高端漫画
多年前的漫画,那时候Python还没有现在这么火,不过,Python的确是门神奇的语言,一对比就看出来了。
良月柒
2019/05/14
8850
【漫画】分享16张程序员高端漫画
AI训练数据缺失怎么办?Nvidia:全靠“想象力”
本文介绍了英伟达研究人员利用生成对抗网络(GAN)和无监督学习来创建图像翻译网络,以减少AI训练时间。英伟达通过使用GAN和不同的数据集进行训练,实现了新的结果,包括在不同条件下的天空阴影和树叶显示。这项工作的好处是,网络培训可以更少的标签数据。英伟达的研究表明,使用GAN可以显著减少训练时间,同时提高图像质量。英伟达公司不仅是一家GPU公司,还将人工智能作为其工具,推动边缘计算设备的发展。
企鹅号小编
2017/12/25
6290
AI训练数据缺失怎么办?Nvidia:全靠“想象力”
电子门锁没电的解决办法
一般这种电子门锁可以输入密码,也可以使用机械钥匙。说实话,这钥匙在哪我压根没见过,租的房子,房东都不知道,只能输入密码才行,电池又没有点电,那应该怎么操作呢?
孙叫兽
2021/03/19
1.6K0
驳《编码规范是技术上的遮羞布》自由发挥==摆脱编码规范?X
  看了一坨文字《编码规范是技术上的遮羞布》,很是上火,见人见智,本是无可厚非,却深感误人子弟者众。原文观点做一个简单的提炼:
数据饕餮
2019/01/14
3430
OSX SIP机制的“那些事”
*原创作者:熊猫正正 一、前言 OSX是苹果公司为Mac系列产品开发的专属操作系统,是第一个基于FreeBSD系统采用面向对象操作系统。 从OSX V10.0-V10.8版本开始,OSX系统的代号都是以大型猫科动物为代号,可能老乔也是猫科动物的爱好者吧(我也是猫科动物的忠实爱好者,哈哈),OSX系统的演化如下: 2001Mac OSX 10.0 Cheeta 猎豹 2001Mac OSX 10.1 Puma 美洲狮 2002Mac OSX 10.2 Jaguar 美州豹 2002Mac OSX
FB客服
2018/02/07
2.8K0
OSX SIP机制的“那些事”
中国版波士顿动力狗玩转一代神车,8只就能拉动载人五菱还会拔河
提到五菱,是的我看到了你扬起的嘴角,以及微笑的眼睛。我知道你脑海里一定也跳出几个关键词:神车、秋名山车神、老司机;瞬间各种五菱名场面在脑海中啪啪啪的闪过有没有!
新智元
2019/08/15
4520
疫情之下,做测试(技术)的你应该如何提升自己?
值得庆幸的是,从数据上来看,咱们国家的疫情已经好转了很多;但是相信你还是听说了一些公司有辞退员工的,有降薪的,有2020年不涨薪的,有升职延期的,还有的公司倒闭的,等等,好惨。 总之,在这样的比较紧张的大环境下,竞争愈加激烈,各企业需要的人少肯定会做出精简,需要的是技术能力更强的人,疫情过后肯定会进行新一轮的扩张,要发展也就需要人,所以不仅仅是疫情期间,我们得时刻准备着,毕竟技术的沉淀是日积月累,不是一朝一夕能成的。 今天就先从四个方面来聊一聊,疫情之下(其实也是任何时候)该如何快速的去成长,提高自身的竞争力呢,让自己更具竞争力。
软测小生
2020/04/01
4540
两图生万物!这个超强图像转换神器,小样本一秒猫狗合体变新物种
动物界,不同物种之间的杂交产生出了很多新的物种。比如说马和驴杂交出现了骡子;狼和狗杂交出现了狼狗;狮和虎杂交出现了狮虎兽和虎狮兽;豹子和狮子杂交出现了豹狮兽等等。
新智元
2020/07/23
7280
两图生万物!这个超强图像转换神器,小样本一秒猫狗合体变新物种
在浏览器训练个剪刀石头布探测器,你的小电脑也可以
假设你回到两年前,现在要让我写一个算法,拍摄一只手的图像,并确定它是石头、剪刀还是布。我会说这有可能实现,但需要给我 6 个月时间。
机器之心
2019/08/26
9720
在浏览器训练个剪刀石头布探测器,你的小电脑也可以
研发效能 | DevOps 已死平台工程才是未来带来的焦虑
最近某位大神在推特上发了一个帖子,结果引来了国内众多卖课机构、培训机构的狂欢,开始贩卖焦虑,其实「平台工程」也不是什么特别高深莫测的东西。闲得无聊,把这位大神的几个帖子薅了下来,你看过之后就会觉得也没啥,都是熟悉的东西。
laofo
2022/11/01
4520
研发效能 | DevOps 已死平台工程才是未来带来的焦虑
江泽民「数学往事」:这道五点共圆题,差点难倒丘成桐
作为一名有文人气质、工程师出身的领导人,江泽民同志虽然不是一位数学家,却在我国的数学界留下了几个值得被铭记的故事。
新智元
2023/01/08
5520
江泽民「数学往事」:这道五点共圆题,差点难倒丘成桐
程序员一亩三分地之外
近些日子,我的一亩三分地内开了几朵不属于技术的花朵,格外美丽,这大概要归功于我阅读的一本书 ——《软技能:代码之外的生存指南》。
程序亦非猿
2019/08/16
5130
丘成桐:为学与做人
犀牛鸟中学创新科研营作为犀牛鸟中学科学人才培养计划的重要环节于近期开营,开营仪式邀请了哈佛大学、清华大学丘成桐教授、腾讯AI Lab及腾讯Robotics X实验室主任张正友博士以及来自清华大学、中国科学院大学、北京邮电大学的四位优秀学长,从对话大师、行业洞察、聚焦成长等方面做了信息学科的知识分享。 本文为丘成桐教授于2020年8月13日为“犀牛鸟中学创新科研营”所作的线上报告的讲稿,内容是在去年同名报告的基础上有所增补。首刊登于《数理人文》(订阅号:math_hmat),未经许可,不得转载。 作者简介:
腾讯高校合作
2020/08/24
8250
丘成桐已全职加入清华
金磊 发自 凹非寺 量子位 | 公众号 QbitAI 首位菲尔兹奖华人得主丘成桐,受聘清华大学讲席教授! △丘成桐,图源:清华大学官方 这便是清华大学宣布的一则重磅消息。 现如今,丘成桐已从哈佛大学退休,这也就意味着他在清华大学是“全职”的状态。 对此,中国科学院院士、复旦大学教授李骏表示: 丘成桐先生的加入,将使清华在数学领域的发展更上一层楼,为国内数学学科的发展、中国数学明天的辉煌以及实现前辈们建设数学强国的愿望作出历史性贡献。 而随着丘成桐的加入,使得清华已经聚齐三位世界顶级科学奖项的“首位华人得
量子位
2022/04/21
3530
丘成桐已全职加入清华
推荐阅读
相关推荐
C++信奥教学PPT:CSP_J_算法之双指针算法(中)
更多 >
领券
社区富文本编辑器全新改版!诚邀体验~
全新交互,全新视觉,新增快捷键、悬浮工具栏、高亮块等功能并同时优化现有功能,全面提升创作效率和体验
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
查看详情【社区公告】 技术创作特训营有奖征文