首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >一文读懂对抗机器学习Universal adversarial perturbations | CSDN博文精选

一文读懂对抗机器学习Universal adversarial perturbations | CSDN博文精选

作者头像
AI科技大本营
发布2019-10-24 14:58:11
1.6K0
发布2019-10-24 14:58:11
举报

作者 | Icoding_F2014

来源 | CSDN博客

本文提出一种 universal 对抗扰动,universal 是指同一个扰动加入到不同的图片中,能够使图片被分类模型误分类,而不管图片到底是什么。示意图:

形式化的定义:

对于d维数据分布 μ,里面的每一个样本

,存在一个分类器

。v是一个扰动,v满足:

同时,还有一个范数的约束:

换句说,需要找到一个对抗扰动v,这个扰动可以加到所有的样本点上,而且会以1−δ的概率让对抗样本被分类错误。

作者提出了一种算法来寻找这种对抗扰动:

其中:

表示把寻到到的扰动v限制在

范数下以ε 为半径的球上。

这个算法的思想是:

从u里面采样出一个样本集 X ,里面有m个图片,然后迭代地寻找能够让m个样本以1−δ概率被分类错误的对抗扰动。

一开始v=0,没有什么扰动,然后对于每个样本

,看它加上扰动v后,会不会分类错误,如果分类错误,则下一个样本; 否则寻找一个微小的扰动

,使得

对抗效果:

基于一个数据集,寻找到的universal 对抗扰动,可以使得新样本也分类错误:

其中X是训练集,Val是验证集。

不同模型寻找到universal扰动,也可以使其它模型分类错误,这是模型间的迁移性,注意这里的迁移性与常规的对抗样本的迁移性有一些不同。

X 训练集样本量的影响:

作者使用的是ImageNet,改数据集有1000类。可以看出当X包含4000个样本时,每个类平均4个样本,攻击成功率可以达到70%左右。而x包含500个样本,平均每个类0.5个样本,对抗成功率也有30%。

Universal pertubations存在性解释:

对于验证集里面的每个样本x,我们寻找它的对抗扰动r(x)=

这种r(x) r(x)r(x)其实可以近似看作是分类模型在x xx处的决策界的法向量,因为它很小,只改x的一点点就让分类器得到其它的标签。

作者提取n个样本处的这种法向量,并对它们进行单位化,形成正规矩阵N:

通过对N进行SVG分解,作者发现N的奇异值有一些特别大,而另外一些特别小:

这种现象意味着,这些法向量其实可以存在冗余的,换句话说这些法向量所在决策界存在着冗余性和相关性。

基于SVG分解的前100 100100个向量张成的对抗扰动,也能取得38%的对抗准确性。这就说明了,神经网络学习得到的决策界,在高维空间是存在相似的相关性的。

通过样本子集X可以获得m个样本的决策界相关性,这种相关性在其它不同的样本周围的决策界上依然存在。

Universal Pertubation则是以最大化成功率的使用这些法向量构建扰动,因而它也会学习到决策界的相关性。

启发与未来工作点

  • Universal pertubations的存在,使得我们可以通过预训练找好这种通用扰动,然后在实际预测的时候直接把这些扰动加到正常样本上来实施攻击。在这种攻击模式下,攻击者在预测阶段是可以做到实时的,可以不用像传统方法那样花大量的时间针对测试阶段遇到的样本计算对抗扰动。在实时对抗领域,universal pertubation会有很大的空间。
  • 应该也可以使用GAN来产生这种universal pertubation。Generator接受噪声 z ,产生universal pertubations,然后把这种扰动加到所有的正常样本 x 上,使得鉴别器 kˆ(⋅) \hat k(·)

(⋅)(这个鉴别器可以事先训练,GAN训练过程中固定住它)把 x+v x+vx+v识别错,同时在损失函数中加入对 v 的范数约束。

  • 有目标的pertubations.文中提到的方法是无targeted的,只要universal pertubation把原始样本被分类器识别错了就行。这里的targeted可以是:1. 只针对特定的类别做干扰的,例如 universal pertubations可以加到所有图片上,但只会把含有狗的图片这类特殊对象攻击成功。2. Universal pertubations加到所有图片上后,会把所有图片的狗的得分都大化,而不管图片是不是真的有狗。

代码地址:

https://github.com/LTS4/universal

本文转自CSDN博客,转载请联系原作者。扫码查看作者更多文章。

(*本文为 AI科技大本营转载文章,请联系原作者)

推荐阅读

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2019-10-22,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 AI科技大本营 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 推荐阅读
相关产品与服务
SD-WAN 接入服务
SD-WAN 接入服务(SD-WAN Access Service)助力多分支轻松实现与云、数据中心的任意互联,具有即插即用、多地域覆盖、智能管控等特性,为企业多分支提供了更简单、可靠、智能的一站式上云的体验。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档