开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

每刷新它一次，你都将得到一个从未存在过的人

文章来源：企鹅号 - 麻省理工科技评论

最近，一个名为

thispersondoesnotexist.com

（这个人不存在.com）

打开网页后，就会直接看到一张人脸图片，每次刷新都会换一张。除此以外，网站上没有任何说明，真心简单粗暴。

图片里有这样的高颜值选手：

但大多数时间是这样的路人：

也许还能刷出诡异的超自然力量持有者：

看到最后一张图，也许你已经意识到了问题：为什么我要不停刷新看奇怪的人脸感觉这些人脸有哪里不对？

事实上，这些人并非真实存在，也不是经过PS制作而成，而是由一个名为 StyleGAN 的AI 工具生成的。当你每次刷新网站时，其背后的神经网络就会依据一个 512 维的向量，生成一张全新人脸图片。

该网站的创建者是一名 Uber 工程师，名为 Philip Wang，其初衷是想要“提高公众对该技术的认知程度。”不过，发明 StyleGAN 的并不是他。

StyleGAN 的原理

说到 StyleGAN，首先要提一下生成式对抗网络（GAN）。生成式对抗网络是一种通过神经网络“左右互搏”的方式，让人工智能系统自主学会如何生成十分逼真的图片、视频、音频等输出的机器学习技巧。生成式对抗网络也在去年被《麻省理工科技评论》评为“2018 年十大突破性技术”之一（

点击了解更多

）。

StyleGAN 则是一种更先进的生成式对抗网络，是此前英伟达 ProGAN 模型的升级版。

英伟达在 2018 年 12 月公布了 StyleGAN 的相关研究成果，最近还在 GitHub 上开源了代码、预训练网络、以及来自 Flikr 平台的 7 万张高清人脸图片数据集。

研究团队借鉴了风格迁移（Style Transfer）的概念，在维持 ProGAN 判别器和损失函数不变的前提下，重新设计了生成器的架构，从而更好地掌控和规划图像合成过程，在一定程度上解决了黑箱问题，而且还提升了合成图像的清晰度和稳定性。

最重要的是，StyleGAN 依靠的是无监督式学习，可以无需人类帮助，自动掌握如何剥离图片的不同特征。

（来源：lyrn.ai）

新的生成器模型效仿了之前 ProGAN 技术中的渐进层概念，将一副图片视为不同特征的集合，然后建立三个层级，分别负责控制图像中的不同特征：

粗糙（Coarse）：涵盖 4²-8²的分辨率，影响姿势、一般发型和脸型等

中等（Middle）：涵盖 16²-32²的分辨率，影响更精细的面部特征和发型，睁眼还是闭眼等

精细（Fine）：涵盖 64²-1024²的分辨率，影响整体颜色（眼睛、头发和皮肤）和微观特征

具体来说，改变或制作一张人脸图片，会参照和混合三个层级提供的样式，可以用来混合的特征包括性别、肤色、脸型、姿势、表情、胡须、是否戴眼镜、头发长度和颜色等等。

改变最笼统的第一层，会对图片造成很大影响，产生一些根本性的变化，比如性别，脸的朝向，是否戴眼镜和五官结构等。

改变第二层，对图片产生的整体影响稍弱，但也可以分辨出较大改变，比如眼睛大小，嘴型，胡须和头发颜色等。

至于最为精细的第三层，主要负责润色图片的整体颜色，比如图片色调，肤色和背景等。

图片来源：英伟达

除此之外，人脸上还有很多随机的特征元素，例如皱纹、雀斑和头发丝等。StyleGAN 将它们视为噪声，添加到合成网络中的每一个分辨率层级中，并且可以通过改变单个分辨率层级的特征来控制噪声的视觉表达，让生成的图片更加逼真。

当然，本着万物皆可二次元的原则，StyleGAN 也可以这样用：

图片来源：gwern/Twitter

以假乱真的Deepfake

虽然 StyleGAN 目前仍然存在一些渲染问题，就像开头看到的那个充满诡异气息的崩坏图片，还有部分面部细节经不起推敲，但在某些场景下，它足可以起到迷惑作用，让人怀疑自己看到的到底是不是真人。

说到这里，就不得不提到另一个“魔改神器”——Deepfake，其名字就很清楚的解释了它的作用，Deep 取自于深度学习的 Deep Learning，fake 则代表着伪造，合起来就是基于深度学习的伪造技术，适用于修改图片和影像。

这项技术在 2017 年底突然爆红，起初是因为有人在色情视频中引入了 Deepfake 技术，将其中女主角的脸，替换成了一些当红女明星的脸。由于视频中角色的脸部动作和视角变化较少，因此除了个别帧数出现渲染模糊和混乱的问题，Deepfake 的替换效果足以以假乱真。

图 | 通过 Deepfake技术，盖尔·加朵的脸被加在了这位女优身上（来源：reddit）

这些被修改过的色情视频在 Reddit，Twitter 和 Pornhub 等平台迅速传播，涉及到的女明星包括盖尔·加朵，艾玛·沃特森和泰勒·斯威夫特等等。鉴于其造成的恶劣影响，各大社交平台都开始封杀 Deepfake 视频。该技术的开发者也在 GitHub 上呼吁，“不要将 Deepfake 的换脸技术用于色情视频，它的价值并不在此。”

全球最大的老司机网站 Pornhub 也曾明确表示要删除 Deepfake 视频，不过似乎收效甚微。如果直接搜索 Deepfake 关键词，的确什么都没有，但是如果直接搜索人名，还是会有意想不到的收获。只是这突如其来的秀，闪到了我的腰…

图 | 网友求助 UP 主（来源：Pornhub）

“假货”的克星：区块链！

无论是 Deepfake 还是 StyleGAN ，开发者的初衷并没有丝毫恶意，技术本身也没有罪。但在 AI 技术愈发普及，开源社区愈发发达的今天，很多功能强大的 AI 工具变得唾手可得，我们不得不承认，作恶者在网上兴风作浪的成本确实降低了。

想要在网上传播虚假图片和视频，甚至不需要摆拍和绿幕，直接通过软件就可以生成。这些高质量的伪造信息和资料，一旦被有心人利用，足以在尚未澄清之前，混淆大众视听，对个人的名誉和人身造成巨大伤害，甚至在关键的问题上，误导决策者。

图 | 美国演员 Jordan Peele 用 Deepfake 技术“扮演”奥巴马讲话（来源：YouTube）

比如在美国大选前夕，放出一段伪造的总统候选人不雅视频片段，其带来的后果和影响将是无法估量的。

为了解决这一问题，已经有初创公司涉足相关研究，包括传统 IT 安全公司和新兴区块链公司。

从本质上看，虚假信息的传播问题可以有两种控制方法：一是从源头入手，寻找证据，查验信息的真实性；二是从数字信息本身入手，检查是否存在修改痕迹。

而区块链技术拥有身份证明和不可篡改特性，刚好适用于以上两种方法。

图 | Amber 的移动端 App

一家名为 Amber 的区块链公司就开发了基于以太坊的解决方案，可以从录像设备入手，直接将视频资料分成固定时间长度的片段，再计算出哈希值，以加密的形式，连同时间、地点和时长等信息一起储存在区块链中。

在需要验证时，系统可以直接检查资料的哈希值与区块链上的记录是否吻合，分辨哪一段视频被篡改过。

还有另一家区块链公司 Factom 也在进行类似的尝试，他们开发了自己的区块链，用于储存视频的哈希值等信息，作为证明数字资料真实性的证据。美国国土安全部曾在 2018 年 6 月向该公司提供了 19 万美元，用于相关技术的研发和实用性测试。

其实自互联网诞生以来，良莠不齐的信息就充斥其中，只不过随着技术的升级，它们的迷惑性也越来越强，由此引发的网络诈骗、钓鱼网站和隐私信息被盗事件屡见不鲜。

大多数时间扮演吃瓜群众的我们，在寄希望于新技术和规范诞生的同时，也需要提升自己的认知水平，避免听风就是雨，不要总想搞个大新闻，拒绝成为虚假信息的二次传播者。

-End-

参考：

https://github.com/NVlabs/stylegan

https://arxiv.org/pdf/1812.04948v2.pdf

https://www.lyrn.ai/2018/12/26/a-style-based-generator-architecture-for-generative-adversarial-networks/

https://www.theverge.com/tldr/2019/2/15/18226005/ai-generated-fake-people-portraits-thispersondoesnotexist-stylegan

https://ambervideo.co/

https://www.factom.com/solutions/connect/

https://www.dhs.gov/science-and-technology/news/2018/06/15/news-release-dhs-awards-austin-based-factom-inc-192k

发表于: 2019-02-192019-02-19 19:10:27
原文链接：https://kuaibao.qq.com/s/20190219G15G7000?refer=cp_1026
腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号（企鹅号）传播渠道之一，根据《腾讯内容开放平台服务协议》转载发布内容。
如有侵权，请联系 cloudcommunity@tencent.com 删除。

相关快讯

扫码

添加站长进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群