前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >【语言模型】开源 | 对分布内和分布外数据的校准语言模型微调

【语言模型】开源 | 对分布内和分布外数据的校准语言模型微调

作者头像
CNNer
发布2020-12-15 11:33:55
4810
发布2020-12-15 11:33:55
举报
文章被收录于专栏:CNNer

论文地址: http://arxiv.org/pdf/2010.11506v1.pdf

代码: 公众号回复:09091027250

来源: 乔治亚理工学院

论文名称:Calibrated Language Model Fine-Tuning for In- and Out-of-Distribution Data

原文作者:Lingkai Kong

内容提要

由于过参数化,调优的预训练语言模型可能会对分布内和分布外(OOD)数据产生严重的误校准。为了缓解这一问题,本文提出了一种正则化的微调方法。为了更好地校准,我们的方法引入了两种正则化方法:(1)对流形进行正则化,通过在数据流形内插值生成伪对流形样本。用这些伪样本进行增强训练后,通过平滑正则化来改进分布内校准。(2)非流形正则化,鼓励模型对伪非流形样本输出均匀分布,以解决OOD数据的过度自信问题。实验表明,该方法在期望校正误差、误分类检测和良好的文本分类检测等方面都优于现有的文本分类校准方法。

主要框架及实验结果

声明:文章来自于网络,仅用于学习分享,版权归原作者所有,侵权请加上文微信联系删除。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2020-12-04,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 CNNer 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档