从一个“换脸”魔法开始,让我们走近优酷AI魔法学院

利用AI完成视频换脸,曾经在去年底引起过全球科技媒体的广泛讨论。时至如今,普通人是否能够玩一下这个有点“科幻”味道的技术呢? 刚刚一条微博引起了办公室的注意。情况是这样的,正当我春困秋乏地琢磨着工作,突然我一位身为居老师迷妹的同事尖叫了起来。整个让全办公室瞬间清爽的分贝,引发了我的好奇,原来她在看一条长这样的微博:

本着对AI换脸的关注,我在居老师粉丝们的热烈讨论背景音中,研究了一下这个优酷提供的换脸玩法。发现值得一聊的技术因素还真是挺多。 我相信大家都会认同这样一个逻辑:当你看到一个技术驾轻就熟的时候,背后其实有千万个技术支撑着它。而从换脸这件事中,我们或许也有机会一窥优酷这样的视频平台,是如何部署、研发和应用AI技术,打造用户体验升级的。 看过《哈利波特》的小伙伴都知道,一个咒语背后,是一个巫师的法力,再背后是一个魔法学院的教育。而AI也是如此,我们看到了一个AI玩法,背后可能隐藏着整个技术实体和无数工程师、科学家的辛勤努力。优酷的换脸魔法恰好可以看做这样一个入口,让我们可以窥视背后的那个视频魔法王国。 当然了,首先让我们先从这个引发无数尖叫的“换脸跟居老师组CP”到底是怎么实现的说起。 咒语显灵:想跟爱豆组CP,一秒就够了 研究了一下我们发现,视频大换脸是优酷为了今年双11打造的一个互动玩法。 进入优酷搜“换脸”关键词,就会跳转到这样的画面。

用户只要输入一张正面照,就可以轻松完成视频换脸。把一段视频中的主角换成自己,跟爱豆组CP,参与热门综艺,变身丞相骂王朗,都不是问题。 其中有一些选项,简直对粉丝是大杀器啊。比如:

请迷妹们暂时收起口水,咱们先正经起来,看看这个玩法为什么受欢迎,尤其是它的技术突破在哪里。 显然,我们可以看到的是,相比纯技术平台的换脸服务,优酷提供了一项普通用户不需要任何技术门槛就可以尝鲜的换脸。也就是说,普通用户心水了很久的把男/女主角换成自己的心愿终于达成,可以跟爱豆直接生成视频CP,代入感极强。 值得注意的是,观看优酷生成的换脸视频,很容易发现两件事: 1. 效果精准逼真,对人脸的捕捉和还原非常自然。不会出现五官僵硬,或者跳帧的情况。这是很多复杂的换脸程序做不到的。 2. 精准的体验建立在简单的数据输入基础上。优酷的换脸玩法,操作非常简单,只需要一张照片就可以完成换脸。要知道,正常的换脸程序是需要用户上传前后左右各种照片的,普通用户甚至根本没有那么多角度的照片。 要做到这些,其实并没有那么容易,背后隐藏着优酷在AI技术上的充沛积累。 魔杖中的秘密:换脸术背后的优酷AI秘籍 神奇换脸术的背后,是一大堆技术难题等待解决,比如视频是立体多角度的,那么用户上传的照片没有这些角度怎么办?比如每个人的五官和脸型都不同,如何保证替换精度?这些难关的攻破,隐含着优酷整体上的AI技术高度。

比如我们可以从这几个技术逻辑,看待换脸魔法背后,优酷在AI领域的积累。 1. 海量数据训练,磨炼出的小数据学习能力。 大部分换脸系统,都需要用户上传大量图片,并对肤色、光线环境等有苛刻要求,优酷可以用一张图片完成换脸,秘诀在于背后海量的人脸数据学习,已经让系统达成了通用人脸能力。而这直接体现出的,就是优酷作为积累海量内容的视频平台,在AI三要素中的数据积累上达成的高度。之前很热门的优酷吻戏鉴定师话题,侧面折射出优酷的训练数据量之庞大,以及对数据深度挖掘的意愿与能力,这些数据能力,正在转化成优酷的AI优势。

2. 面部动作捕捉精准算法。 换脸玩法当中,优酷的算法模型不只是对五官进行标注,而且对包括颧骨、下颚等36个标注点进行标注。这意味算法模型在人脸识别、图像分割、动作捕捉等领域的精准能力。AI是算法精度打天下,显然优酷在换脸上也展示了算法研发能力的优势。

3.相对高鲁棒性的人脸融合。 换脸的一大问题,在于用户上传照片,可能在光源、颜色、光影等方面与原视频不同,从而可能产生贴合度等问题。从优酷的换脸效果看,其算法本身的鲁棒系数较优,而这也是更多AI视频应用落地的先决条件。 看似简单的换脸背后,实际隐藏着优酷在AI世界中的三张王牌。如果向更上一层看去,会发现AI技术正在带给优酷全方位的能力加持。对于AI能力的搞研发力与高应用度,正在流媒体行业中等待发挥重要作用。 悄悄打开的魔法学院大门:AI正在成为文娱新引擎 从优酷接连抛出的AI技术惊喜,我们已经可以看出优酷在AI技术上的追求。这些高水准的AI技术能力,又与其他AI技术体系联合在一起,构成了今天我们在视频平台追片时,可能体验到的各种AI应用。 以优酷为例,我们可以看到AI可以迎接双11,带来换脸这种高流量玩法,也可以对用户观看视频、平台剪辑制作视频产生影响。 人脸识别、背景识别、场景识别、用户喜好模型分析,以及体态识别、动作追踪等等技术,都是可以直接利用在视频场景中的人工智能技术。这些AI魔法不断从底层涌入优酷的视频交互世界,我们可以清晰看到两件事正在发生: 首先,是基于人脸识别的明星脸数据标记,正在让用户追剧变得越发轻松自在。

今天的视频平台用户,在手机端利用碎片化时间追综艺已经形成了常态。于是就出现了想要单追某一明星,比如在综艺、影视剧中只看自己爱豆出场画面的情况。在AI的帮助下,优酷可以利用AI后台智能剪辑功能,生产出海量明星CUT、综艺精彩片段、热播影视剧集。于是用户可以让AI帮忙找出自己想看的爱豆,轻松实现智能化追片。 其次,AI还可以是平台提高剪辑效率,以及内容生产效率的助手。 面对庞大的内容数据集群,剪辑和创作其实是相当费时费力的一件事,比如在重大足球赛事上,想要剪辑进球、射门、犯规等集锦,过去是需要庞大团队昼夜赶工的一件事,并且球迷还要等上数小时甚至一天才能看到。 而在今年世界杯上,优酷AI技术通过网罗以往赛事数据建立资讯库,把足球比赛中常用的射门、进球、犯规、过人、精彩集锦等片段结构化、标签化储存为模板。当赛事直播中出现匹配片段时,即可迅速实现分析识别,截取直播流精彩片段,最快10秒通过机器生产创作更多有趣、多角度的视频内容,由优酷全站推送给用户,满足用户多样性需求,也为内容生产者提供更多资源与素材。在降低人工成本的同时极大地提升了内容生产效率。

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20181031A0UZYJ00?refer=cp_1026
  • 腾讯「云+社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 yunjia_community@tencent.com 删除。

扫码关注云+社区

领取腾讯云代金券