首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

每刷新它一次,你都将得到一个从未存在过的人

最近,一个名为

thispersondoesnotexist.com

(这个人不存在.com)

打开网页后,就会直接看到一张人脸图片,每次刷新都会换一张。除此以外,网站上没有任何说明,真心简单粗暴。

图片里有这样的高颜值选手:

但大多数时间是这样的路人:

也许还能刷出诡异的超自然力量持有者:

看到最后一张图,也许你已经意识到了问题:为什么我要不停刷新看奇怪的人脸感觉这些人脸有哪里不对?

事实上,这些人并非真实存在,也不是经过PS制作而成,而是由一个名为 StyleGAN 的AI 工具生成的。当你每次刷新网站时,其背后的神经网络就会依据一个 512 维的向量,生成一张全新人脸图片。

该网站的创建者是一名 Uber 工程师,名为 Philip Wang,其初衷是想要“提高公众对该技术的认知程度。”不过,发明 StyleGAN 的并不是他。

StyleGAN 的原理

说到 StyleGAN,首先要提一下生成式对抗网络(GAN)。生成式对抗网络是一种通过神经网络“左右互搏”的方式,让人工智能系统自主学会如何生成十分逼真的图片、视频、音频等输出的机器学习技巧。生成式对抗网络也在去年被《麻省理工科技评论》评为“2018 年十大突破性技术”之一(

点击了解更多

)。

StyleGAN 则是一种更先进的生成式对抗网络,是此前英伟达 ProGAN 模型的升级版。

英伟达在 2018 年 12 月公布了 StyleGAN 的相关研究成果,最近还在 GitHub 上开源了代码、预训练网络、以及来自 Flikr 平台的 7 万张高清人脸图片数据集。

研究团队借鉴了风格迁移(Style Transfer)的概念,在维持 ProGAN 判别器和损失函数不变的前提下,重新设计了生成器的架构,从而更好地掌控和规划图像合成过程,在一定程度上解决了黑箱问题,而且还提升了合成图像的清晰度和稳定性。

最重要的是,StyleGAN 依靠的是无监督式学习,可以无需人类帮助,自动掌握如何剥离图片的不同特征。

(来源:lyrn.ai)

新的生成器模型效仿了之前 ProGAN 技术中的渐进层概念,将一副图片视为不同特征的集合,然后建立三个层级,分别负责控制图像中的不同特征:

粗糙(Coarse):涵盖 4²-8²的分辨率,影响姿势、一般发型和脸型等

中等(Middle):涵盖 16²-32²的分辨率,影响更精细的面部特征和发型,睁眼还是闭眼等

精细(Fine):涵盖 64²-1024²的分辨率,影响整体颜色(眼睛、头发和皮肤)和微观特征

具体来说,改变或制作一张人脸图片,会参照和混合三个层级提供的样式,可以用来混合的特征包括性别、肤色、脸型、姿势、表情、胡须、是否戴眼镜、头发长度和颜色等等。

改变最笼统的第一层,会对图片造成很大影响,产生一些根本性的变化,比如性别,脸的朝向,是否戴眼镜和五官结构等。

改变第二层,对图片产生的整体影响稍弱,但也可以分辨出较大改变,比如眼睛大小,嘴型,胡须和头发颜色等。

至于最为精细的第三层,主要负责润色图片的整体颜色,比如图片色调,肤色和背景等。

图片来源:英伟达

除此之外,人脸上还有很多随机的特征元素,例如皱纹、雀斑和头发丝等。StyleGAN 将它们视为噪声,添加到合成网络中的每一个分辨率层级中,并且可以通过改变单个分辨率层级的特征来控制噪声的视觉表达,让生成的图片更加逼真。

当然,本着万物皆可二次元的原则,StyleGAN 也可以这样用:

图片来源:gwern/Twitter

以假乱真的Deepfake

虽然 StyleGAN 目前仍然存在一些渲染问题,就像开头看到的那个充满诡异气息的崩坏图片,还有部分面部细节经不起推敲,但在某些场景下,它足可以起到迷惑作用,让人怀疑自己看到的到底是不是真人。

说到这里,就不得不提到另一个“魔改神器”——Deepfake,其名字就很清楚的解释了它的作用,Deep 取自于深度学习的 Deep Learning,fake 则代表着伪造,合起来就是基于深度学习的伪造技术,适用于修改图片和影像。

这项技术在 2017 年底突然爆红,起初是因为有人在色情视频中引入了 Deepfake 技术,将其中女主角的脸,替换成了一些当红女明星的脸。由于视频中角色的脸部动作和视角变化较少,因此除了个别帧数出现渲染模糊和混乱的问题,Deepfake 的替换效果足以以假乱真。

图 | 通过 Deepfake技术,盖尔·加朵的脸被加在了这位女优身上 (来源:reddit)

这些被修改过的色情视频在 Reddit,Twitter 和 Pornhub 等平台迅速传播,涉及到的女明星包括盖尔·加朵,艾玛·沃特森和泰勒·斯威夫特等等。鉴于其造成的恶劣影响,各大社交平台都开始封杀 Deepfake 视频。该技术的开发者也在 GitHub 上呼吁,“不要将 Deepfake 的换脸技术用于色情视频,它的价值并不在此。”

全球最大的老司机网站 Pornhub 也曾明确表示要删除 Deepfake 视频,不过似乎收效甚微。如果直接搜索 Deepfake 关键词,的确什么都没有,但是如果直接搜索人名,还是会有意想不到的收获。只是这突如其来的秀,闪到了我的腰…

图 | 网友求助 UP 主(来源:Pornhub)

“假货”的克星:区块链!

无论是 Deepfake 还是 StyleGAN ,开发者的初衷并没有丝毫恶意,技术本身也没有罪。但在 AI 技术愈发普及,开源社区愈发发达的今天,很多功能强大的 AI 工具变得唾手可得,我们不得不承认,作恶者在网上兴风作浪的成本确实降低了。

想要在网上传播虚假图片和视频,甚至不需要摆拍和绿幕,直接通过软件就可以生成。这些高质量的伪造信息和资料,一旦被有心人利用,足以在尚未澄清之前,混淆大众视听,对个人的名誉和人身造成巨大伤害,甚至在关键的问题上,误导决策者。

图 | 美国演员 Jordan Peele 用 Deepfake 技术“扮演”奥巴马讲话(来源:YouTube)

比如在美国大选前夕,放出一段伪造的总统候选人不雅视频片段,其带来的后果和影响将是无法估量的。

为了解决这一问题,已经有初创公司涉足相关研究,包括传统 IT 安全公司和新兴区块链公司。

从本质上看,虚假信息的传播问题可以有两种控制方法:一是从源头入手,寻找证据,查验信息的真实性;二是从数字信息本身入手,检查是否存在修改痕迹。

而区块链技术拥有身份证明和不可篡改特性,刚好适用于以上两种方法。

图 | Amber 的移动端 App

一家名为 Amber 的区块链公司就开发了基于以太坊的解决方案,可以从录像设备入手,直接将视频资料分成固定时间长度的片段,再计算出哈希值,以加密的形式,连同时间、地点和时长等信息一起储存在区块链中。

在需要验证时,系统可以直接检查资料的哈希值与区块链上的记录是否吻合,分辨哪一段视频被篡改过。

还有另一家区块链公司 Factom 也在进行类似的尝试,他们开发了自己的区块链,用于储存视频的哈希值等信息,作为证明数字资料真实性的证据。美国国土安全部曾在 2018 年 6 月向该公司提供了 19 万美元,用于相关技术的研发和实用性测试。

其实自互联网诞生以来,良莠不齐的信息就充斥其中,只不过随着技术的升级,它们的迷惑性也越来越强,由此引发的网络诈骗、钓鱼网站和隐私信息被盗事件屡见不鲜。

大多数时间扮演吃瓜群众的我们,在寄希望于新技术和规范诞生的同时,也需要提升自己的认知水平,避免听风就是雨,不要总想搞个大新闻,拒绝成为虚假信息的二次传播者。

-End-

参考:

https://github.com/NVlabs/stylegan

https://arxiv.org/pdf/1812.04948v2.pdf

https://www.lyrn.ai/2018/12/26/a-style-based-generator-architecture-for-generative-adversarial-networks/

https://www.theverge.com/tldr/2019/2/15/18226005/ai-generated-fake-people-portraits-thispersondoesnotexist-stylegan

https://ambervideo.co/

https://www.factom.com/solutions/connect/

https://www.dhs.gov/science-and-technology/news/2018/06/15/news-release-dhs-awards-austin-based-factom-inc-192k

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20190219G15G7000?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

相关快讯

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券