文章/答案/技术大牛

发布

社区首页 >问答首页 >在NLP中，gpt-2的正确输入是什么？

问在NLP中，gpt-2的正确输入是什么？
EN

Data Science用户

提问于 2020-12-11 17:29:15

回答 1查看 6.7K关注 0票数 4

我正在微调预训练的gpt-2文字摘要。数据集包含“文本”和“参考摘要”。因此，我的问题是，如何添加特殊的令牌，以获得正确的输入格式。目前我在想这样做：

example1 参考摘要，example2 参考摘要，.

这是正确的吗？如果是这样的话，接下来的问题是最大标记长度(即gpt-2的1024 )是否也意味着连接的文本长度和参考摘要？

任何评论都将是非常感谢的！

nlp

data-science-model

transformer

gpt

回答 1

Data Science用户

发布于 2020-12-11 18:09:27

旧答案

GPT-2是一种因果语言模型.这意味着，在默认情况下，它要么完全不接收输入，要么接收句子/段落的初始标记。然后，它完成作为输入传递的任何内容。因此，它并不意味着要像你尝试的那样使用它。

通常，为了进行条件文本的生成，人们使用一种编解码结构，即一个完整的编解码转换器，而不是只有解码器部分的GPT-2。

然而，虽然它并不意味着你使用它的方式，但这是有可能的。例如，以前曾在这篇NeurIPS 2018年年的文章中做过这样的事情，它只使用转换器解码器进行机器翻译、连接源和目标侧，就像您所做的那样：

不过，您需要执行一些调整。具体来说，原始GPT-2词汇表没有您使用的特殊令牌。相反，它只有<|endoftext|>来标记结束。这意味着，如果您想使用您的特殊标记，您将需要将它们添加到词汇表中，并在微调期间对它们进行培训。另一种选择是在您的<|endoftext|>、和中简单地使用D19。

对于GPT- 2，只有一个序列，而不是2。因此，最大令牌长度将适用于文本和参考摘要的连接。

P.S.：我认为您使用的原因是，其他非生成模型(如伯特 )使用类似的特殊令牌([SEP]、[CLS])，并且专门设计为接收两个连接段作为输入。然而，伯特不是一种生成性语言模型，因为它不是以一种自回归的方式训练的，而是带着一种蒙面的LM损失：

票数 8

页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://datascience.stackexchange.com/questions/86566

复制

相似问题

问在NLP中，gpt-2的正确输入是什么？
EN

回答 1

Data Science用户

最新答案

旧答案

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问在NLP中，gpt-2的正确输入是什么？EN

回答 1

Data Science用户

最新答案

旧答案

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问在NLP中，gpt-2的正确输入是什么？
EN