首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
您找到你想要的搜索结果了吗?
是的
没有找到

帝国理工联手谷歌提出抽象文本摘要最佳模型 | ICML 2020

另外,本文为进一步提升最先进结果,引入了一个新收集的文本语料库,该语料库由新闻类文章组成包括 XSum 和 CNN/DailyMail 摘要数据集,统称为 HugeNews。...(4)对模型结果进行人工评估,结果表明在 XSum, CNN/DailyMail 和 Reddit TIFU 上的摘要效果与人工摘要比肩。...实验表明 GSR 低于 50% 较好,在 CNN/DailyMail 数据集上 15% 的比例可以得到最优结果。...在 XSum 和 CNN/DailyMail 上,Unigram 96kROUGE 得分最高。...特别是,在 XSum 和 CNN/Dailymail 数据集被大量研究的情况下,该模型仅使用 1000 个示例就达到了与人工摘要相媲美的结果。这表明,使用大量的监督样本不再是文本摘要所必须的了。

71120

NeurIPS 2019 | 既能理解又能生成自然语言,微软提出统一预训练新模型UniLM

此外,UniLM 在五个自然语言生成数据集上成为了新的当前最佳,包括将 CNN/DailyMail 抽象式摘要 ROUGE-L 结果提升至 40.51(2.04 的绝对改善)、将 Gigaword 抽象式摘要...作者使用了 CNN/DailyMail 数据集和 Gigaword 的非匿名化版本来进行模型微调和评估。 表 3 在 CNN/DailyMail 上比较了 UniLM 与基准和几种当前最佳的模型。...表 3:在 CNN/DailyMail 摘要任务上的评估结果。上半部分的模型是抽取式系统,这里列出以供参考;下半部分的模型是抽象式模型。...此外,UniLM 在五个 NLG 数据集上优于之前最佳模型,即:CNN/DailyMail 和 Gigaword 抽象式摘要、SQuAD 问题生成、CoQA 生成式问答、DSTC7 对话响应生成。

73820
领券