为什么我的微调过的DistilGPT2模型没有生成新的行？

5285890804800438606.jpghttp://1300407952.vod2.myqcloud.com/8cf72ee1vodcq1300407952/fecb48485285890804800438605/5285890804800438606.jpg http://1300407952.vod2.myqcloud.com/8cf72ee1vodcq1300407952/8830f42e5285890804860416474/5285890804860416475.jpg

浏览 914提问于2020-07-06

1回答

使用Docker的Transformers - Load预训练模型

、

我正在尝试使用transformers lib加载一个预先训练好的模型(通过拥抱脸)： from transformers import GPT2Tokenizer, GPT2Model tokenizer= GPT2Tokenizer.from_pretrained('gpt2-medium') 使用本地机器，它开始下载模型。但使用docker时，我得到的结果如下： OSError: Model name 'gpt2-medium' was no

浏览 25提问于2020-09-15得票数 0

2回答

System.Threading.Timer中回调过程中的FOR循环导致它只触发一次

看起来，循环中的操作在第一次完成后不再执行。我已经做了一个变通方法，使用while(true)无限循环，并使用Thread.Timer在x毫秒后暂停进程。我的带有while循环的新修改代码如

浏览 0提问于2012-07-23得票数 2

1回答

用Huggingface库进行对抗性训练的差异生成语句

、、、、

我有以下的目标，我一直在努力实现与拥抱面对图书馆，但我遇到了一些障碍。我想在训练时以一种可微性的方式生成句子。我为什么要这么做？我想要对这个输出应用一个鉴别器来生成具有某些属性的句子，这些属性是由判别器“强制执行”的。这些句子也将以一个输入句子为条件，所以我需要一个编码器解码器模型。这个类有一个名为generate的方

浏览 3提问于2020-06-24得票数 5

2回答

微调与再培训

、、、

因此，我正在学习如何使用Tensorflow对自定义数据集的Inception-v3模型进行微调。再培训和微调有什么区别？我的印象是，

浏览 5提问于2017-07-17得票数 4

1回答

Rails:将模型连接到另一个模型

、、、、

我刚刚在我的数据库中为我的微博表创建了新的列，这些列是vote_count comment_count，我想将它们连接到投票模型、vote_up计数和注释模型注释计数。由于我只是添加了这些列，尽管有投票和评论，我如何连接这些其他模型到微博模型，以填写新的列。任何建议都是非常感谢的</e

浏览 2提问于2012-03-03得票数 0

回答已采纳

1回答

使用DistilBERT生成文本的句子

、

您好，我已经使用了非常棒的库huggingface转换器在GPT2中生成文本，效果非常好：input_ids，现在我想用更小更简单的DistilmBERT模型做同样的事情，它也是104种语言的多语言，所以我想用这个轻便的模型生成例如西班牙语和英语的文本

浏览 0提问于2020-05-25得票数 1

1回答

为什么实体数据模型向导不生成一个反映db表的实体，缺省值为getdate()？

、、

我有一个数据库表，其中一列是datetime类型的。此列的默认值设置为getdate()。使用EDM向导，我生成了实体模型。不幸的是，生成的实体模型类没有将新行的列设置为创建该行的日期。为什么EDM向导不生成反映具有默认值getdate()的db表的实体？

浏览 2提问于2011-03-07得票数 1

回答已采纳

2回答

如何修复古鲁冥想错误:核心1恐慌(LoadProhibited)错误

、、

我正试图为ESP32芯片编写代码，它接收来自DHT22传感器的读数，将其打包到json文件中，然后将其发送到一个烧瓶服务器。，但没有结果，我也不知道发生了什么。这是我的Arduino代码：#include <WiFi.h>#include <ArduinoJson.h> #它可以很好地打印出json文档，但没有打印出"Got“

浏览 1提问于2020-08-13得票数 0

6回答

对于python，有什么现成的语言模型吗？

、、

我正在建立一个应用程序的原型，我需要一个语言模型来计算一些生成的句子的困惑。assert p1 < p2 我看过一些框架，但找不到我想要的。我知道我

浏览 0提问于2018-09-20得票数 16

回答已采纳

2回答

从Rails 4应用程序中的字符串数组生成CSV

、、、

在我的控制器中，我正在创建一个字符串数组。我想要创建一个CSV，它将数组的每个元素简单地放在一个新的行上。它们已经是分隔逗号的字符串。我一直试图用控制器中的代码创建CSV文件：@metrics = ["Group Name,1", "25", "44,2,5"] respond_to do |format|form

浏览 3提问于2016-04-12得票数 1

回答已采纳

1回答

为什么我们要对语言模型进行微调，而不只是将数据包含在培训前的数据集中？

、

关于语言模型的预培训和微调过程的一个问题:为什么使用一个小数据集微调而不是将微调数据集包含在培训前数据集中更好呢？还是我误解了，通常微调数据集已经包含在训练前的数据集中，而我们只改变学习参数以更好地适应数据属性？任何论文参考都是非常欢迎的！谢谢。

浏览 0提问于2021-07-29得票数 0

回答已采纳

2回答

AttributeError: GPT2TokenizerFast对象没有属性“max_len”

、、、、

我只是在使用huggingface库，并在运行run_lm_finetuning.py时获得以下消息: AttributeError：'GPT2TokenizerFast‘对象没有属性'max_len’其他有这个问题的人，或者怎么解决这个问题的想法？谢谢!我的完整实验: mkdir实验-模型名称或路径distilgpt2-列车数据文件small_

浏览 26提问于2021-04-14得票数 2

回答已采纳

1回答

屏蔽语言模型处理，更深层次的解释

、

我正在详细研究BERT模型(you can found the description here)，我正在清楚地理解为什么需要在20%的时间内保留或替换随机单词，或者只是将掩码标记始终用于掩码语言模型我们尝试训练双向技术，文章解释了“在微调过程中看不到掩码令牌”，但对我来说，这是两个不同的步骤，我们首先训练双向，然后再进行下游任务。如果有人能给我解释一下我的理解哪里错了。

浏览 20提问于2019-03-08得票数 0

回答已采纳

2回答

如何修复Java中的“TableModel.setValueAt ArrayIndexOutOfBoundsException”错误

、、

我有一个JTable应用程序。我需要更改单元格值并保存数据，但是只有索引小于或等于4的单元格才在数组范围内。java.awt.EventDispatchThread.pumpEvents(EventDispatchThread.java:93)我希望能够更改表中的所有单元格值，但我只能对其中的几个进行更改。索引大于或等于5的单元格返回Ar

浏览 0提问于2019-01-09得票数 0

回答已采纳

1回答

解决音频广播错误:客户端连接失败的DYNAMIC_KEY_EXPIRED (Agora.io)

我是一个服务器端开发人员，掌握基本的JS技术。我正在修补Agora的音频广播功能(特别是网络)。作为参考，我一直在跟踪以下内容：我的理解是，完成上述工作将使我能够播放音频。当我尝试这样做时，我<

浏览 2提问于2020-05-07得票数 0

回答已采纳

3回答

sencha touch微加载器在iOS中不起作用

、、

我创建了一个sencha touch 2/phonegap应用程序，它在安卓上运行良好，需要把它放到iOS中。我成功地做到了这一点，然后做了一个小的代码更改(将卡片动画从左到右)，应用程序停止加载。 index.html出现了，但看起来微加载器没有被调用。不执行任何ST javascript。我已经尝试在XCode中创建一个新的iPhone应用程序，我已经确保我已经引用了Mac phonegap文件，<em

浏览 3提问于2012-05-28得票数 1

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云