首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >Huggingface变压器启动

Huggingface变压器启动
EN

Stack Overflow用户
提问于 2021-02-03 09:56:49
回答 1查看 131关注 0票数 1

我试图复制this demo的结果,它的作者用just编写了下面的文本:

代码语言:javascript
运行
复制
gpt.add_example(Example('apple', 'slice, eat, mash, cook, bake, juice'))
gpt.add_example(Example('book', 'read, open, close, write on'))
gpt.add_example(Example('spoon', 'lift, grasp, scoop, slice'))
gpt.add_example(Example('apple', 'pound, grasp, lift'))

我只能通过Huggingface Transformer访问GPT-2。我如何在Huggingface上启动GPT-2 large来复制上述示例?问题是,使用this时,不能分别使用输入和相应的输出(正如上面的GPT-3演示的作者所做的那样)。

类似地,this tutorial描述了如何使用Huggingface,但没有示例清楚地说明如何使用输入与输出示例来准备它。

有人知道怎么做吗?

所需的输出:使用GPT-2返回类似的内容,对于输入“土豆”,输出"peel,slice,cook,mash,bake“(如GPT-3demo:https://www.buildgpt3.com/post/41/所示)。显然,输出动词的确切列表不会与GPT-2和GPT-3是相同的模型。

EN

回答 1

Stack Overflow用户

发布于 2021-02-03 18:17:22

GPT模型唯一能做的就是预测后面应该跟什么词。从技术上讲,没有输入和输出,它是一个只有解码器的模型,所以它只有输出。启动模型意味着您将模型的输出强制为您想要的内容,然后让模型继续生成更多的文本。

演示中发生的情况是:

  1. 您为GPT-3提供了它应该做什么的自然语言示例。如下所示:

代码语言:javascript
运行
复制
What can I do with an apple? slice eat, mash, cook, bake, juice
What can I do with a book? read, open, close, write on
What can I do with a spoon? lift, grasp, scoop, slice

  1. 当出现查询(例如,knife)时,您可以创建一个与以下示例类似的句子:

代码语言:javascript
运行
复制
What can I do with a knife?

  1. 让模型继续生成,直到它开始一个以What开头的新行,或者直到它以一种奇怪的方式中断,这在随机模型中总是会发生的。(希望模型得到了您在启动示例中所指的模式。)

下面是来自HuggingFace's demo的一个使用GPT-2的示例。粗体文本是由模型生成的。

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/66020205

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档