首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
您找到你想要的搜索结果了吗?
是的
没有找到

机器学习理论 | 大型神经语言模型的对抗训练

泛化性和鲁棒性是设计机器学习方法的关键。对抗性训练可以增强鲁棒性,但过去的研究经常发现它会损害泛化能力。在自然语言处理(NLP)中,预训练的大型神经语言模型(如BERT)在各种任务的泛化方面表现出了令人印象深刻的增益,而且通过对抗性微调还可以得到进一步的改进。然而,这些模型仍然容易受到对抗性攻击。在本文中,我们证明了对抗性预训练可以提高泛化性和鲁棒性。我们提出了一种通用算法ALUM(Adversarial training for large neural LangUage Models,大型神经语言模型的对抗性训练),它通过在嵌入空间中施加扰动使对抗性损失最大化来调整训练目标。我们首次全面研究了对抗性训练的各个阶段,包括从头开始的预训练、在训练有素的模式下持续的预训练以及特定任务中的微调。ALUM在各种NLP任务上都比BERT获得了可观的收益,无论是在常规场景还是在对抗场景中。即使是在非常大的文本语料库上受过良好训练的模型,如RoBERTa,ALUM仍然可以从连续的预训练中获得显著的收益,而传统的非对抗性方法则不能。ALUM可以进一步与特定任务的微调相结合,以获得额外的收益。代码和预训练模型可在以下网址获得:https://github.com/namisan/mt-dnn。

03
领券