前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >商汤科技发布迄今最大人脸检测数据集,绝杀Deepfake

商汤科技发布迄今最大人脸检测数据集,绝杀Deepfake

作者头像
马上科普尚尚
发布2020-05-13 16:14:25
7690
发布2020-05-13 16:14:25
举报
文章被收录于专栏:人工智能前沿讲习

近日,发表于Venturebeat的一篇文章称,商汤科技研究院与新加坡南洋理工大学合作设计了迄今为止最大的人脸伪造检测数据集——DeeperForensics-1.0

换脸是一种深度伪造技术,它从现实中提取人脸,并用其他人的面部特征代替,通常通过人工智能或机器学习实现。

目前,它已经被MixBooth和SnapChat等应用推广开来,虽然底层的技术使复杂的图像编辑成为可能,但这也引发了人们对潜在的错用或滥用的担忧。

相关组织已经编译了很多被操控媒体的资料,以支持人脸交换检测方法的发展,但到目前为止公布的样本数量相对较少,或者人为因素影响较大。

研究人员表示,DeeperForensics-1.0是一种新的大规模的人脸伪造检测数据集,被称为是同类中最大的语料库,有超过6万个视频,大约有1760万帧。

研究人员称,DeeperForensics-1.0中的所有源视频都是经过精心挑选的,因为它们的质量和多样性都很高。

从表面上看,它们比其他数据集更真实,因为它们更接近于现实世界中的检测场景,并且它们包含与in the wild的压缩,模糊和传输伪像相匹配的特征。

为了构建DeeperForensics-1.0,研究人员收集了来自26个不同国家的100名演员的面部数据,他们的年龄从20岁到45岁不等,他们被要求在九种不同的灯光下转动头部,用超过53种表情自然地说话。

他们通过一个人工智能框架(DeepFake Variational AutoEncoder,简称DF-VAE)来运行这些数据,该框架使用了1000个YouTube视频作为目标视频,其中100名演员的脸被交换到10个目标面部上。

他用35种不同的方式扭曲每个视频来模拟真实世界的场景,最终的数据集包含了5万个未经处理的视频和1万个经过处理的视频。

研究人员在一份详细说明其工作的印论文中写道:“我们发现,源面部在构建高质量数据集方面比目标面部发挥着至关重要的作用。”“特别是,源面部的表情,姿势和照明越丰富,面部特征交换后的质量越高。”

研究人员还在DeeperForensics-1.0中创建了他们所谓的“隐藏”测试集——一组精心挑选的400个视频,以便在真实场景中更好地模拟假视频。

策划这组视频的过程包括收集由未知的换脸方法生成的假视频,并用真实场景中常见的失真来掩盖这些假视频,最后只选择在用户研究中愚弄了至少50个(总共100个)人类观察者的视频。

为了评估DeeperForensics-1.0与其他公开数据集的质量,研究人员让100名计算机视觉专家对其中一部分视频的质量进行排序。

他们报告称,与FaceForensics++、Celeb-DF和其他流行的deepfake检测语料相比,DeeperForensics-1.0在真实性方面领先。

在未来的工作中,研究团队打算逐步深入取证领域,并与研究社区合作,确定人脸伪造检测方法的评估指标。

与Deepfake的斗争似乎正在升温。去年夏天,美国国防部高级研究计划局的媒体取证项目成员测试了一个原型系统,该系统可以自动检测人工智能生成的视频,部分方法是寻找类似眨眼不自然这样的线索。

初创公司Truepic在7月获得了800万美元的融资,它们正在试验deepfakes的“探测即服务”商业模式。

2019年12月,Facebook与人工智能合作伙伴、微软和学术界共同发起了Deepfake探测挑战,该挑战将提供数百万美元的资助和奖励,以促进Deepfake探测系统的发展。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2020-01-29,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 人工智能前沿讲习 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档