这项技术可以合成以假乱真的奥巴马视频

安妮 编译自 IEEE Spectrum 量子位出品 | 公众号 QbitAI

奥巴马镇楼

可能奥巴马也要分辨不出自己视频的真假了,这也不能怪他。

一种新算法可以用现有的音频与视频素材,合成高逼真的假视频。也就是说,我们可以将一段音频加到任意视频片段中,看起来会像视频里的人真的在说这段话。

奥巴马的假视频就是这样被合成的,看起来还比较流畅——

视频请去百度云观看,地址: https://pan.baidu.com/s/1eSGf96q

这项技术由华盛顿大学SUPASORN SUWAJANAKORN等三人共同发明,他们坦言,之所以选用奥巴马做研究范例,是因为他的高清视频资源获取非常容易,并且不受版权限制。

因此,研究小组用神经网络分析了数百万帧的视频,来确定奥巴马的面部表情如何变化。开口说话需要整个面部器官的协调,所以研究人员不仅分析了口型变化,还包括他的嘴唇、牙齿和下巴周围的皱纹,甚至还包括脖子与衣领。

该技术研发人员之一IRA指出,这项技术可以用于改善视频会议的质量——电话会议中的视频输出可能会有口吃、卡顿或分辨率低等现象,但音频传输通常非常流利。

因此在将来,视频会议可能会变成传话人传输音频,并使用该软件重建人物谈话时的面部表情。

研究人员也指出,目前的合成视频并不完美(也会穿帮)。当视频中的奥巴马将抬头向上看时,可能嘴巴会出现在脸部之外。

因为这个算法不会模仿情绪,所以有时输出的奥巴马视频看起来会不合时宜地非常严肃,或者对于严肃的演讲来说,显得太开心了。

两组原视频与合成视频对比图

心疼奥巴马。

最后,附奥巴马表情包论文地址:

http://grail.cs.washington.edu/projects/AudioToObama/siggraph17_obama.pdf

原文发布于微信公众号 - 量子位(QbitAI)

原文发表时间:2017-07-13

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏VRPinea

谷歌秋季发布会明天开启,“Pixel”系列会成为移动VR的全新里程碑?

3727
来自专栏程序员的知识天地

百万年薪挖大学教授做程序员,学生变成上司,这样好吗?

网友们则是议论纷纷,有网友说百万年薪的程序员多如够啊,这个导师是有多自卑,BAT的部分程序员都可以血虐他了,还比他年轻一大把。

1530
来自专栏程序员的知识天地

程序员入职阿里3天收到腾讯offer, 资薪只高一点, 网友: 你看着办

入职阿里第三天收到了腾讯的offer,职级一样,腾讯的薪资略高一点,走还是留?这个话题很是火爆啊,网友们都各执己见,并且也有很多网友点赞,认为这个问题提的好,网...

2631
来自专栏VRPinea

《Pokemon GO》将添加更多飞行系和龙系宠物,包括人气神兽烈空座

2888
来自专栏企鹅号快讯

智能家居“智商”不够,能靠情商来补吗

试着去想象这样一个场景:当我们结束辛苦的工作回到家中,只需要花费几秒钟进行一个极其简单的操作,灯光就会依次缓缓打开,空调也会随之自动调节到我们最习惯的温度……如...

2039
来自专栏镁客网

因明知Pixel手机麦克风硬件存在缺陷还坚持销售,谷歌被告上法庭 | 热点

1040
来自专栏华章科技

他用数据重现父亲一生

今天我们介绍一位可视化大师尼古拉斯·费尔顿(Nicholas Felton),他用自己独特的方式表达对父亲的纪念——用数据展示父亲的一生。

1094
来自专栏大数据和云计算技术

政务大数据系列10:政务大数据的运营

政务是个大市场,阿里、腾讯、电信、华为都在赔本赚吆喝。本文作者宇同学是资深从业人士,研发总监,他会写一系列文章来阐述政务云全景。 前面九篇...

6145
来自专栏程序员互动联盟

自学编程成功概率有几何?

坦白的讲一个人获得知识的方法有两种,一个是通过别人教,另一种就是自己学,然而通过别人教的方式一般都是需要付出一些金钱的,比如我上学的时候需要教学费,培训的时候就...

3028
来自专栏镁客网

Varjo要实现人眼级别分辨率,宣称秒杀市面上所有头显

1343

扫码关注云+社区

领取腾讯云代金券