前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >GAN如何异常检测?最新《生成式对抗网络异常检测》综述论文,概述异常检测的典型GAN模型

GAN如何异常检测?最新《生成式对抗网络异常检测》综述论文,概述异常检测的典型GAN模型

作者头像
新智元
发布2021-10-13 11:16:47
2.7K0
发布2021-10-13 11:16:47
举报
文章被收录于专栏:新智元新智元


新智元报道

作者:专知

【新智元导读】异常检测是许多研究领域所面临的重要问题。生成对抗网络(GANs)和对抗训练过程最近被用来面对这一任务,产生了显著的结果。本文综述了主要的基于GAN的异常检测方法,并突出了它们的优缺点。

异常是数据中不符合正常行为的定义(Chandola et al., 2009)的模式。

生成式对抗网络(GAN)和对抗训练框架(Goodfellow et al., 2014)已成功应用于真实世界数据复杂和高维分布的建模。这种GAN特性表明它们可以成功地用于异常检测,尽管它们的应用只是最近才被探索出来。

使用GAN进行异常检测的任务是使用对抗性训练过程建模正常行为,并测量异常评分来检测异常(Schlegl等人,2017)。

据我们所知,所有基于gan的异常检测方法都是基于对抗性特征学习思想(Donahue et al., 2016),其中提出了BiGAN架构。

在最初的公式中,GAN框架学习了一个将样本从任意潜在分布(噪声之前)映射到数据的生成器,以及一个试图区分真实样本和生成样本的鉴别器。

BiGAN架构扩展了原始的模拟,增加了逆映射的学习,将数据映射回潜在的表示。一个将输入数据映射到其潜在表示的学习函数和一个相反的函数(生成器)是使用GAN进行异常检测的基础。

https://arxiv.org/abs/1906.11632

在第1节,我们介绍了GANs框架,并简要介绍了其最具创新性的扩展,即条件GAN和BiGAN,分别在第1.2节和第1.3节。第2节介绍了使用GAN进行异常检测的最新架构。在第3节中,我们对所有分析的架构进行了经验评估。最后,第四部分是结论和未来的研究方向.

GAN异常检测

基于GAN的异常检测是一个新兴的研究领域。Schlegl et al.(2017),这里称为AnoGAN,是第一个提出这一概念的人。

Zenati等人(2018)提出了一种基于BIGAN的方法,这里称为EGBAD (Efficient GAN Based Anomaly Detection),其性能优于AnoGAN的执行时间。

最近,Akcay等人(2018)提出了一种基于GAN +自编码器的方法,其性能超过了EGBAD。

AnoGAN

通过一个GAN的生成器G来学习正常数据的分布,测试时图像通过学习到的G找到它应该的正常图的样子,再通过对比来找到异常与否的情况。

训练阶段:

对抗训练,从一个噪声向量Z通过几层反卷积搭建的生成器G学习生成正常数据图像。

测试阶段:

随机采样一个高斯噪声向量z,想要通过已经训练好的G生成一幅和测试图像x对应的正常图像G(z)。

G的参数是固定的,它只能生成落在正常数据分布的图像。但此时仍需进行训练,把z看成待更新的参数,通过比较G(z)和x的差异去更新,从而生成一个与x尽可能相似、理想对应的正常图像。

如果x是正常的图像,那么x和G(z)应该是一样的。

如果x异常,通过更新z,可以认为重建出了异常区域的理想的正常情况,这样两图一对比不仅仅可以认定异常情况,同时还可以找到异常区域。

EGBAD

高效基于GAN的异常检测(EGBAD) (Zenati et al., 2018)将BiGAN架构引入到异常检测领域。

特别是,EGBAD试图利用Donahue等人(2016)和Dumoulin等人(2017)的工作来解决AnoGAN的缺点,该工作允许学习一个编码器E,能够在对抗性训练期间将输入样本映射到它们的潜在表示

GANomaly

GANomaly 以编码器-解码器-编码器设计模型,通过对比编码得到的潜在变量和重构编码得到的潜在变量差异,从而判断是否为异常样本。

文章在无异常样本训练模型的情况下实现了异常检测,对于很多场景都有很强的实际应用意义。

GANomaly 模型对框架由三部分组成:

GE(x), GD(z) 统称为生成网络,可以看成是第一部分。这一部分由编码器 GE(x) 和解码器 GD(z) 构成,对于送入数据 x 经过编码器 GE(x) 得到潜在向量 z,z 经过解码器 GD(z) 得到 x 的重构数据 x̂ 。

模型的第二部分就是判别器 D,对于原始图像 x 判为真,重构图像 x̂ 判为假,从而不断优化重构图像与原始图像的差距,理想情况下重构图像与原始图像无异。

模型的第三部分是对重构图像 x̂ 再做编码的编码器 E(x̂) 得到重构图像编码的潜在变量 ẑ。

在训练阶段,整个模型均是通过正常样本做训练。也就是编码器 GE(x),解码器 GD(z) 和重构编码器 E(x̂),都是适用于正常样本的。

当模型在测试阶段接受到一个异常样本,此时模型的编码器,解码器将不适用于异常样本,此时得到的编码后潜在变量 z 和重构编码器得到的潜在变量 ẑ 的差距是大的。

我们规定这个差距是一个分值

,通过设定阈值 ϕ,一旦 A(x)>ϕ 模型就认定送入的样本 x 是异常数据。

参考资料:

https://mp.weixin.qq.com/s/yOoDkTyZMmaFygt5MiGWtw

https://arxiv.org/abs/1906.11632

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2021-09-17,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 新智元 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 【新智元导读】异常检测是许多研究领域所面临的重要问题。生成对抗网络(GANs)和对抗训练过程最近被用来面对这一任务,产生了显著的结果。本文综述了主要的基于GAN的异常检测方法,并突出了它们的优缺点。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档