前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
社区首页 >专栏 >【GPT】开源 | 清华大学提出对新数据进行高效持续预训练的模型ELLE

【GPT】开源 | 清华大学提出对新数据进行高效持续预训练的模型ELLE

作者头像
CNNer
发布于 2023-02-28 02:53:44
发布于 2023-02-28 02:53:44
5520
举报
文章被收录于专栏:CNNerCNNer

论文地址: http://arxiv.org/pdf/2203.06311v2.pdf

来源: 清华大学

论文名称:ELLE: Efficient Lifelong Pre-training for Emerging Data

原文作者:Yujia Qin

内容提要

现有的预训练语言模型(PLM)通常使用固定的、不更新的数据进行训练,而忽略了在现实场景中,各种来源的数据可能会不断增长,而这需要PLM能够持续地整合新旧信息。虽然这个目标可以通过对所有新老数据重新大规模训练来实现,但众所周知,这样的过程在计算上是十分昂贵的。为此,本文提出了ELLE,旨在对新来的数据进行高效的持续预训练。具体来说,ELLE包括(1)功能维持的模型扩展,它能够灵活地扩展现有PLM的宽度和深度,以提高知识获取的效率;(2)预植领域提示词(prompt),从而让模型能够更好地区分预训练期间学到的通用知识,正确地激发下游任务的知识。我们在BERT和GPT上使用来自5个领域的数据来试验,结果表明ELLE在预训练效率和下游性能方面优于各种传统的持续学习方法。

主要框架及实验结果

声明:文章来自于网络,仅用于学习分享,版权归原作者所有。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2023-02-24,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 CNNer 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
R海拾遗-双因素重复测量方差分析
重复测量方差分析 sunqi 2020/7/26 概述 双因素的重复测量资料方差分析 代码 数据获得 library(tidyverse) library(ggpubr) library(rstatix) rm(list=ls()) set.seed(123) data("selfesteem2", package = "datarium") # 抽样 selfesteem2 %>% sample_n_by(treatment, size = 1) ## # A tibble: 2 x 5 ## id
火星娃统计
2020/09/15
1.9K0
R海拾遗-双因素重复测量方差分析
R海拾遗-单项重复测量方差分析
对于单项的方差分析,如果不满足上述假设,使用Friedman test进行,对于双向、三向的方差分析没有替代的非参数方法,只能通过装换数据
火星娃统计
2020/09/15
2K0
R海拾遗-单项重复测量方差分析
数据分析:假设检验方法汇总及R代码实现
显著性检验方法,通常也被称为假设检验方法,是统计学中用于评估样本统计量是否显著不同于某个假设值的一种重要工具。以下是假设检验方法使用时需要考虑的三个条件的书面化表述:
生信学习者
2024/06/20
7700
数据分析:假设检验方法汇总及R代码实现
R语言单、双因素方差分析及结果可视化的简单小例子
这里用到的是R语言的内置数据集sample_n_by()函数很有用,能够分组随机抽样%>% 是管道符 是将前面的结果传输给后面的函数
用户7010445
2021/08/31
6.3K1
R语言单、双因素方差分析及结果可视化的简单小例子
R语言重复测量数据的多重比较
使用的数据来自孙振球,徐勇勇《医学统计学》第4版。课本的电子版已上传到QQ群,加群即可免费获取!
医学和生信笔记
2022/11/15
1.1K0
R语言重复测量数据的多重比较
「R」管道统计分析——rstatix使用指南
rstatix 包提供了一个与「tidyverse」设计哲学一致的简单且直观的管道友好框架用于执行基本的统计检验, 包括 t 检验、Wilcoxon 检验、ANOVA、Kruskal-Wallis 以及相关分析。
王诗翔呀
2020/07/03
2.9K0
「R」管道统计分析——rstatix使用指南
R海拾遗_naniar
通常情况下,我们使用summary函数或者is.na对缺失值进行查看,但是当数据量增大的时候,就显得有点费力了,在visdat包中,有两个函数vis_dat和vis_miss用于可视化缺失查看
火星娃统计
2021/01/12
9580
R海拾遗_naniar
R海拾遗-tidyverse
tidyverse函数高效,代码简洁,受过专业训练的一般都用这个,除非记不住,能记一点是一点吧。 love&peace
火星娃统计
2020/09/15
1.2K0
R语言方差分析总结
这篇文章涵盖了孙振球,徐勇勇《医学统计学》第4版中关于方差分析的章节,包括:多样本均数比较的方差分析/多因素实验资料的方差分析/重复测量设计资料的方差分析/协方差分析。
医学和生信笔记
2022/11/15
2.7K0
R语言方差分析总结
R海拾遗_再谈非标准评估
上面的例子summary的变量是disp,分组变量是cyl和am,使用三个点这里传递了任意个参数
火星娃统计
2021/06/29
7270
R语言倾向性评分:回归和分层
倾向性评分有4种应用,前面介绍了倾向性评分匹配及matchIt和cobalt包的使用:R语言倾向性评分:匹配
医学和生信笔记
2023/02/14
1.4K0
R语言倾向性评分:回归和分层
R优雅的进行统计分析(2)自定义添加统计信息
❝本节来介绍如何使用R语言来做统计分析,通过「rstatix」包进行统计检验,完全使用tidyverse体系进行数据清洗及可视化,使用add_pvalue,stat_pvalue_manual两个函数来自定义添加p值 ❞ 加载R包 library(tidyverse) library(rstatix) library(ggprism) library(ggpubr) library(ggsci) 数据清洗 df <- ToothGrowth %>% mutate(dose=as.factor(d
R语言数据分析指南
2022/09/21
7600
R优雅的进行统计分析(2)自定义添加统计信息
超强的gtSummary ≈ gt + comparegroups ??
在R语言中绘制表格的包我们介绍了非常多,除了专门绘制基线资料表的compareGroups/tableone/table1,还介绍了绘制普通表格的gt,以及扩展包gtExtra。
医学和生信笔记
2022/11/15
1.8K0
超强的gtSummary ≈ gt + comparegroups ??
R:绘制临床三线表
R数据处理能力非常强大,而且输出也非常灵活。当然在R里面的输出都是print字符形式,我们在R里面看到结果很一目了然,但是往往需要把这些结果放在三线表里面。 在临床研究中,我们经常要用到三线表来展示数据与统计值。R可以输出统计参数及检验参数,一个个往上粘贴很困难。
Jamesjin63
2022/10/25
8550
R:绘制临床三线表
dplyr_下篇
Note that the echo = FALSE parameter was added to the code chunk to prevent printing of the R code that generated the plot.
火星娃统计
2020/09/15
6980
临床预测模型概述6-统计模型实操-单/多因素Logistic回归
既往推文已经介绍过了logistic,cox,lasso回归(https://mp.weixin.qq.com/s/pXRZ1rYUr3lwH5OlDeB0_Q),接下来将重点进行代码的实操。
凑齐六个字吧
2024/08/07
1760
临床预测模型概述6-统计模型实操-单/多因素Logistic回归
R包基础实操—tidyverse包
核心软件包是ggplot2、dplyr、tidyr、readr、purrr、tibble、stringr和forcats,它们提供了建模、转换和可视化数据的功能。
生信技能树jimmy
2021/10/11
3.5K0
R包基础实操—tidyverse包
临床预测模型概述6-统计模型实操-单/多因素Cox回归
https://mp.weixin.qq.com/s/pXRZ1rYUr3lwH5OlDeB0_Q
凑齐六个字吧
2024/08/08
3600
临床预测模型概述6-统计模型实操-单/多因素Cox回归
「R」数据操作(七):dplyr 操作变量与汇总
除了选择已存在的列,另一个常见的操作是添加新的列。这就是mutate()函数的工作了。
王诗翔呀
2020/07/06
2.6K0
「R」数据操作(七):dplyr 操作变量与汇总
R语言亚组分析及森林图绘制
亚组分析的森林图很常见,在各种高分SCI文章中经常见到,其中我最喜欢NEJM的格式,美观,信息量也多。
医学和生信笔记
2023/08/30
1.9K0
R语言亚组分析及森林图绘制
相关推荐
R海拾遗-双因素重复测量方差分析
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
查看详情【社区公告】 技术创作特训营有奖征文