IBM提出深度学习模型水印方法,可防止侵权

编译:chux

出品:ATYUN订阅号

如果机器学习模型可以在照片,电影,音乐和手稿添加水印以表明所有权,防止知识产权窃取,并防止攻击者损害其完整性,该会如何呢?IBM正在申请新的专利,他们可以做到这一点。

IBM认知网络安全情报经理Marc Ph.Stoecklin详细介绍了IBM研究人员将独特标识符嵌入神经网络的工作。他们的概念最近在韩国的ACM亚洲计算机和通信安全会议(ASIACCS)上发布,可能会在IBM内部进行部署,或者在不久的将来作为面向客户的产品发布。

“这是我们第一次用强有力的方式来证明某人进行了剽窃,”Stoecklin表示,“深度神经网络模型需要强大的计算机,神经网络专业知识和训练数据,然后才能得到一个高度准确的模型。它们很难建造,所以它们很容易被剽窃。任何有价值的东西都将成为目标,包括神经网络。”

IBM并不是第一个提出深度学习模型水印方法的,KDDI研究所和国家信息学研究所的研究人员于2017年4月发表了一篇关于该主题的论文。但正如斯托克林所指出的那样,以前的概念需要了解被盗模型的知识,这些参数是远程部署的,剽窃服务不太可能公开。

而IBM团队的方法独特之处是允许应用程序使用API查询来验证神经网络服务的所有权。这对于防止对抗性攻击至关重要,例如,之前欺骗计算机视觉算法将猫视为“疯狂的被子”,或强迫自动驾驶汽车无视停车标志。

那么它是怎样工作的?这是一个两步过程,涉及嵌入阶段,其中水印应用于机器学习模型,以及检测阶段,它可以被提取以证明所有权。

研究人员开发了三种算法来生成三种相应类型的水印:一种是将“有意义的内容”与算法的原始训练数据一起嵌入,另一种是嵌入不相关的数据样本,第三种是嵌入噪声。在将任何三种算法应用于给定神经网络之后,馈送与目标标签相关联的模型数据触发水印。

该团队使用MNIST数据集测试了三种嵌入算法,一个包含60000个训练图像和10000个测试图像的手写数字识别数据集,以及一个包含50000个训练图像和10000个测试图像的对象分类数据集CIFAR10。

结果,所有这些都是“100%有效”。Stoecklin指出,“例如,如果我们的水印是1,我们的模型将由数字形状触发。”

不过它不适用于离线模型,尽管Stoecklin指出在这些情况下剽窃的动机较少,因为这些模型无法套现。并且它无法通过预测API攻击来防止侵权,这些攻击通过发送查询和分析响应来提取机器学习模型的参数。

该团队继续改进该方法,并且如果一切按计划进行,则有可能进行商业化。

原文发布于微信公众号 - ATYUN订阅号(atyun_com)

原文发表时间:2018-07-23

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏AI科技评论

干货 | Siri 语音识别的小心机:你在哪里,就能更准确地识别那附近的地址

AI 科技评论按:这篇文章来自苹果机器学习日记(Apple Machine Learning Journal)。与其他科技巨头人工智能实验室博客的论文解读、技术...

1392
来自专栏智能算法

蚁群算法(独辟蹊径的进化算法)

1. 算法背景——蚁群的自组织行为特征 高度结构化的组织——虽然蚂蚁的个体行为极其简单,但由个体组成的蚁群却构成高度结构化的社会组织,蚂蚁社会的成员有分...

3609
来自专栏大数据文摘

资源 | 从医疗语音到灾难响应,这八大优质数据集快抱走

1853
来自专栏机器人网

21个你必懂的数据科学面试问答

KDnuggets编辑为20个辨别真伪数据科学家的问题准备了答案,包括什么是正规化、我们喜爱的数据科学家、模型验证等等。

1051
来自专栏AI科技评论

动态 | 同济大学「智能大数据可视化实验室」开源FaceX,包含500余万张卡通人脸表情简笔画

AI 科技评论消息,日前,同济大学「智能大数据可视化实验室」(iDVX Lab) 开源了一个包含 500 余万张卡通人脸表情的高质量简笔画数据集 – FaceX...

1463
来自专栏PPV课数据科学社区

基础篇:从 0 到 1 掌握 Python 机器学习(附资源)

Python 可以说是现在最流行的机器学习语言,而且你也能在网上找到大量的资源。你现在也在考虑从 Python 入门机器学习吗?本教程或许能帮你成功上手,从 0...

5108
来自专栏大数据挖掘DT机器学习

受众行为分析与人群定向

“物以类聚,人以群分”这句古语不仅揭示了物与人的自组织趋向,更隐含了“聚类”和“人群”之间的内在联系。 例如在现代数字广告投放系统中,最为关键的“人群定向...

5437
来自专栏机器之心

资源 | 吴恩达《ML Yearning》52章译文,一份很有诚意的GitHub项目

在该 GitHub 项目中,读者可直接下载各章节译文的 MarkDown 文档,也可以下载 PDF 版的英文原版。此外为了有更好的阅读体验,作者为这个项目构建了...

801
来自专栏数据科学与人工智能

【算法】推荐算法--协同过滤

协同过滤推荐(Collaborative Filtering recommendation)是在信息过滤和信息系统中正迅速成为一项很受欢迎的技术。与传统的基于内...

1541
来自专栏大数据文摘

分辨真假数据科学家的20个问题及回答

2113

扫码关注云+社区

领取腾讯云代金券