首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >GPT-2的“提示”中可以输入多少个字符

GPT-2的“提示”中可以输入多少个字符
EN

Stack Overflow用户
提问于 2020-08-13 00:09:45
回答 1查看 857关注 0票数 1

我使用的是来自github的OpenAI GPT-2模型

我认为top_k参数决定了要采样多少个令牌。这是否也是指定提示符大小的参数?

如果top_k = 40,提示符可以有多大?

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2020-08-13 16:54:07

GPT-2不适用于字符级别,而适用于子词级别。在中训练的文本片段的最大长度为1024个子词。

它使用基于byte-pair-encoding的词汇表。在这样的编码下,频繁出现的单词保持不变,不频繁出现的单词被分成几个单元,最终下降到字节级。实际上,分割看起来像这样(69个字符,17个子词):

代码语言:javascript
运行
复制
Hello , ▁Stack Over flow ! ▁This ▁is ▁an ▁example ▁how _a ▁string ▁gets ▁segment ed .

在训练时,提示和答案之间没有区别,因此唯一的限制是提示和答案的总长度不能超过1024个子词。从理论上讲,您可以在此基础上继续生成,但历史模型考虑的时间永远不会更长。

top_k的选择只会影响内存需求。长查询也需要更多内存,但这可能不是主要限制

票数 2
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/63380543

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档