DeepFake技术是可以生成换脸的视频。这些内容生成和修改的技术可能会影响公共话语的质量或者侵犯他人的权力,尤其是考虑到这种伪造的视频可能被而已用来误导、操纵、骚扰和诈骗。
识别这种合成视频是一个要求高技术、且迫切需要的一种技术。这次挑战的目标是促使一种新算法的诞生,来帮助检测深层伪造的合成视频。
这次比赛要预测的就是一个视频是否是伪造的,预测的是一个视频是假视频的概率。
给出的训练数据如下图:
比赛的评估就是用二分类交叉熵。
有意思的是,在比赛初期,很多人的成绩非常差的原因是,这里面的预测值1是fake,0是true,和一般的逻辑是反着的哈哈。
这是一个视频分类任务,把视频分解成多个图像,然后用图像分类之后再汇总起来。
这是两个被伪造的人脸:
这是能看出被伪造的。随机抽取一帧,然后检测人脸,然后将人脸图片截出来。
在截取人脸的时候,一般并不是检测到哪里,就只截取那部分的图片。截图到一个图,然后首先要把长方形扩展到正方形,然后再扩大1.5倍候选框。这样就可以保留更多一些人脸的细节:
黑色是模型检测出来的人脸,然后扩展成红色的正方形,然后再扩大1.5倍变成蓝色的
这里设计了一个检测差异度的指标:
效果如下:
但是这个也有弊端,对于这种仅仅修改了鼻子的图片,这个指标就会这些微小修改的伪造图筛选掉:
最后实验证明,这个指标对最终精度的提升非常可观。机器学习关键还是数据呀!
使用欠采样来平衡。要求在一个batch内,每一个真实的人脸都有其对应的虚假的人脸。
EfficientNet效果最好了。
关键在于使用ShiftScaleRotate(),提高0.02的成绩。
喜欢的话请关注我们的微信公众号~【机器学习炼丹术】。
微信搜索公众号:机器学习炼丹术。期待您的关注。