首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
您找到你想要的搜索结果了吗?
是的
没有找到

基于编码注入的对抗性NLP攻击

研究表明,机器学习系统在理论和实践中都容易受到对抗样本的影响。到目前为止,此类攻击主要针对视觉模型,利用人与机器感知之间的差距。尽管基于文本的模型也受到对抗性样本的攻击,但此类攻击难以保持语义和不可区分性。在本文中探索了一大类对抗样本,这些样本可用于在黑盒设置中攻击基于文本的模型,而无需对输入进行任何人类可感知的视觉修改。使用人眼无法察觉的特定于编码的扰动来操纵从神经机器翻译管道到网络搜索引擎的各种自然语言处理 (NLP) 系统的输出。通过一次难以察觉的编码注入——不可见字符(invisible character)、同形文字(homoglyph)、重新排序(reordering)或删除(deletion)——攻击者可以显着降低易受攻击模型的性能,通过三次注入后,大多数模型可以在功能上被破坏。除了 Facebook 和 IBM 发布的开源模型之外,本文攻击还针对当前部署的商业系统,包括 Microsoft 和 Google的系统。这一系列新颖的攻击对许多语言处理系统构成了重大威胁:攻击者可以有针对性地影响系统,而无需对底层模型进行任何假设。结论是,基于文本的 NLP 系统需要仔细的输入清理,就像传统应用程序一样,鉴于此类系统现在正在快速大规模部署,因此需要架构师和操作者的关注。

01

纽约时报长文:硅谷的尤达—算法大师Donald Knuth

AI科技评论按:Donald Knuth,著名计算机科学家,誉满全球的图灵奖获得者,斯坦福大学计算机系荣誉退休教授。作为现代计算机科学的先驱人物,他发明了计算机排版系统 TEX 和 METAFONT,创造了算法分析的领域,在计算机科学及数学领域发表了多部具广泛影响的论文和著作。日前,纽约时报对他进行了一次专访。在这次访谈中,Knuth 博士谈到了他对算法的一些看法,反思了他 50 年来的作品《The Art of Computer Programming》,并表示:“我担心算法变得太过重要。一开始,我们这些计算机科学家担心没有人听我们的,但现在,听我们的人太多了。” 关于纽约时报的撰文,雷锋网 AI 科技评论编译整理如下:

02

博客 | 纽约时报长文:硅谷的尤达—算法大师Donald Knuth

AI科技评论按:Donald Knuth,著名计算机科学家,誉满全球的图灵奖获得者,斯坦福大学计算机系荣誉退休教授。作为现代计算机科学的先驱人物,他发明了计算机排版系统 TEX 和 METAFONT,创造了算法分析的领域,在计算机科学及数学领域发表了多部具广泛影响的论文和著作。日前,纽约时报对他进行了一次专访。在这次访谈中,Knuth 博士谈到了他对算法的一些看法,反思了他 50 年来的作品《The Art of Computer Programming》,并表示:“我担心算法变得太过重要。一开始,我们这些计算机科学家担心没有人听我们的,但现在,听我们的人太多了。” 关于纽约时报的撰文,雷锋网 AI 科技评论编译整理如下:

04

学界 | 语音合成领域的首个完全端到端模型,百度提出并行音频波形生成模型ClariNet

最近,百度硅谷人工智能实验室的研究员提出了 ClariNet,一种全新的基于 WaveNet 的并行音频波形(raw audio waveform)生成模型。WaveNet 是能够完美模仿人类声音的最前沿语音合成技术(Google I/O 大会所展示的超逼真合成语音的背后技术)。自从其被提出,就得到了广泛的离线应用。但由于其自回归(autoregressive)的特点,只能按时间顺序逐个生成波形采样点,导致合成速度极慢,无法在 online 应用场合使用。ClariNet 中所提出的并行波形生成模型基于高斯逆自回归流(Gaussian inverse autoregressive flow),可以完全并行地生成一段语音所对应的原始音频波形。比起自回归的 WaveNet 模型,其合成速度提升了数千倍,可以达到实时的十倍以上。

00
领券