△ 奥巴马镇楼
可能奥巴马也要分辨不出自己视频的真假了,这也不能怪他。
一种新算法可以用现有的音频与视频素材,合成高逼真的假视频。也就是说,我们可以将一段音频加到任意视频片段中,看起来会像视频里的人真的在说这段话。
奥巴马的假视频就是这样被合成的,看起来还比较流畅——
△ 视频请去百度云观看,地址: https://pan.baidu.com/s/1eSGf96q
这项技术由华盛顿大学SUPASORN SUWAJANAKORN等三人共同发明,他们坦言,之所以选用奥巴马做研究范例,是因为他的高清视频资源获取非常容易,并且不受版权限制。
因此,研究小组用神经网络分析了数百万帧的视频,来确定奥巴马的面部表情如何变化。开口说话需要整个面部器官的协调,所以研究人员不仅分析了口型变化,还包括他的嘴唇、牙齿和下巴周围的皱纹,甚至还包括脖子与衣领。
该技术研发人员之一IRA指出,这项技术可以用于改善视频会议的质量——电话会议中的视频输出可能会有口吃、卡顿或分辨率低等现象,但音频传输通常非常流利。
因此在将来,视频会议可能会变成传话人传输音频,并使用该软件重建人物谈话时的面部表情。
研究人员也指出,目前的合成视频并不完美(也会穿帮)。当视频中的奥巴马将抬头向上看时,可能嘴巴会出现在脸部之外。
因为这个算法不会模仿情绪,所以有时输出的奥巴马视频看起来会不合时宜地非常严肃,或者对于严肃的演讲来说,显得太开心了。
心疼奥巴马。
最后,附奥巴马表情包论文地址:
http://grail.cs.washington.edu/projects/AudioToObama/siggraph17_obama.pdf