文章/答案/技术大牛

发布

社区首页 >问答首页 >GPT-2的“提示”中可以输入多少个字符

问GPT-2的“提示”中可以输入多少个字符
EN

Stack Overflow用户

提问于 2020-08-13 00:09:45

回答 1查看 857关注 0票数 1

我使用的是来自github的OpenAI GPT-2模型

我认为top_k参数决定了要采样多少个令牌。这是否也是指定提示符大小的参数？

如果top_k = 40，提示符可以有多大？

python

nlp

openai

gpt-2

回答 1

Stack Overflow用户

回答已采纳

发布于 2020-08-13 16:54:07

GPT-2不适用于字符级别，而适用于子词级别。在中训练的文本片段的最大长度为1024个子词。

它使用基于byte-pair-encoding的词汇表。在这样的编码下，频繁出现的单词保持不变，不频繁出现的单词被分成几个单元，最终下降到字节级。实际上，分割看起来像这样(69个字符，17个子词)：

Hello , ▁Stack Over flow ! ▁This ▁is ▁an ▁example ▁how _a ▁string ▁gets ▁segment ed .

在训练时，提示和答案之间没有区别，因此唯一的限制是提示和答案的总长度不能超过1024个子词。从理论上讲，您可以在此基础上继续生成，但历史模型考虑的时间永远不会更长。

top_k的选择只会影响内存需求。长查询也需要更多内存，但这可能不是主要限制

票数 2

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/63380543

复制

相似问题

问GPT-2的“提示”中可以输入多少个字符
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问GPT-2的“提示”中可以输入多少个字符EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问GPT-2的“提示”中可以输入多少个字符
EN