令牌索引序列长度大于此模型指定的最大序列长度(651 > 512)，该模型使用拥抱面部情感分类器

、、、、

我正在尝试通过拥抱脸部情感分析预训练模型来获取评论的情感。它像Token indices sequence length is longer than the specified maximum sequence length for this model (651> 512) with Hugging face sentiment classifier一样返回错误。'] 将总行追加到空列表 text = [] for index, row in da

浏览 1832提问于2021-04-05得票数 4

1回答

如何截断变压器库中的Bert令牌程序

、、

我正在使用Scibert预培训模型来获取各种文本的嵌入信息。, truncation=True)我向令牌程序添加了最大长度和截断参数，但不幸的是，它们没有截断results.If --我通过令牌程序运行了更长的文本： inputs = tokenizer("

浏览 3提问于2020-11-27得票数 5

回答已采纳

2回答

用于命名实体识别的PyTorch Huggingface NLP

、、、、

我已经用了相当长一段时间了，用PyTorch实现谷歌的 by 来制作1.0数据集。直到最后一次(11月至2月)，我一直在使用库，并获得了一个F分数 of 0.81为我的命名实体识别任务，通过微调模型。txt in tokenized_texts], maxlen=MAX_LEN, dtype="long", truncating="post", padding="post") ValueError:令牌索引序列</em

浏览 0提问于2019-02-25得票数 5

1回答

令牌索引序列长度大于此模型的指定最大序列长度(28627 >512个)

、、、、

我使用伯特的拥抱脸DistilBERT模型作为一个后端的问答应用程序。我使用的用于训练模型的文本是一个非常大的单个文本字段。即使文本字段是一个字符串，标点符号作为BERT的线索仍然保留在适当的位置。当我执行应用程序时，我将得到“令牌索引序列长度错误”。我使用transform

浏览 4提问于2021-08-22得票数 0

1回答

在大文本上微调GPT-2以生成域文本。

、、、、

尝试在一个非常大的文本上训练GPT-2，以便从特定的域生成文本。我想对他们进行GPT-2的训练，这样以后我就可以从哈利波特领域生成文本了。model.generate(input_ids, max_length=50)错误:令牌索引序列

浏览 1提问于2020-09-16得票数 2

1回答

BERT嵌入层

、

[Batch, Indices]形式的输入，其中Batch是任意大小的(通常是32、64或其他的)，Indices是标记化输入句中每个单词的对应索引。Indices的最大长度为512。从BERT模型的替代实施来看，位置嵌入是一个静态转换。这似乎也是在变压器模型中进行位置编码的传统方法。考虑到替代实现，它使用正弦和余弦函数在输入中

浏览 0提问于2021-05-03得票数 3

回答已采纳

1回答

拥抱面:如何使用bert-大-大在拥抱脸进行长文本分类？

、、、、

我正在尝试使用bert-大-未为长序列结束，但它是错误的：from transformers import BertTokenizer, BertModel RuntimeError: The size of tensor a (1024) must match the size of tensor b (512) at non-singleton dimensi

浏览 30提问于2022-08-06得票数 0

1回答

用RNN学习词嵌入

、、

学习单词嵌入的常用方法是基于弓模型和跳格模型.任何对类似作品的引用都将受到高度赞赏。

浏览 0提问于2018-08-17得票数 3

回答已采纳

1回答

我如何知道与预先训练的托卡器一起使用哪些参数？

、、

有些示例只调用令牌程序tokenizer(data)，其他示例只使用截断tokenizer(data, truncation=True)，而另一些则使用许多参数tokenizer(data, padding由于我是重新加载一个预先训练的托肯器，我希望它使用相同的参数，在最初的培训过程中。我如何知道要使用哪些参数？我的理解是，我总是需要截断我的数据，让max_length留给None，这样我的

浏览 17提问于2022-12-02得票数 1

1回答

使用像BERT这样的预训练模型进行文档分类

、、、

我正在寻找对文档进行分类的方法。对于ex。我有一堆带有文本的文档，我想标记文档是否属于体育、食品、政治等。我可以使用BERT (对于单词>500的文档)来实现这一点吗?或者是否有其他模型可以有效地完成这项任务？

浏览 7提问于2021-02-10得票数 1

2回答

使用spacy v3，我应该更改配置文件中的哪个参数来解决CUDA内存不足的问题？batch_size对max_length对batcher.size

、、、

利用spacy v3，尝试用camemBert训练分类器，得到CUDA out of memory问题。Running this sequence through the model will result in indexing errors在这里解释()，Camembert模型的最大序列长度指定为512我应该将值更改为512吗？根据我的

浏览 8提问于2021-06-30得票数 4

1回答

变压器(如伯特)是否有无限的输入尺寸？

、、、、

互联网上有各种各样的来源声称，伯特的固定输入大小为512个令牌(例如这、这、这、这 .)。在我看来，当NLP从回归模型转变时，我一直认为(RNN/LSTM Seq2Seq，Bahdanau .)对于转换器，我们将可变长度的输入转换为固定长度的输入，这种输入需要为较短的序列填充，并且不能扩展到超过512个令牌(或者其他您想要分配模

浏览 0提问于2023-03-31得票数 3

回答已采纳

1回答

使用encode_plus方法时令牌索引序列长度错误

、、、

在尝试使用Transformers库中提供的encode_plus方法为BERT编码问答对时，我遇到了一个奇怪的错误。我使用的是来自this Kaggle competition的数据。给定问题标题、问题主体和答案，模型必须预测30个值(回归问题)。我的目标是将以下编码作为BERT的输入： CLS question_title question_body SEP应答SEP 但是，当我尝试使用 tokenizer =

浏览 115提问于2020-04-20得票数 7

9回答

如何使用Bert进行长文本分类？

、、

我们知道BERT有一个标记的最大长度限制= 512，那么如果一篇文章的长度远远大于512，比如文本中有10000个标记，如何使用BERT？

浏览 3提问于2019-10-31得票数 47

1回答

面向长文档的集合式文档汇总

、

但是，在文档之后，我所做的任何简单摘要调用都是太长的文档：>>> summarizer(fulltext) Tokenindices sequence length is longer than the specified maximum sequence length for this model (5971 > 512Running this sequence through the mo

浏览 20提问于2021-12-10得票数 3

1回答

精密调谐曲面RobertaForQuestionAnswering的输入/输出格式

、、、、

我试图微调我的自定义数据集上的"RobertaForQuestionAnswering“，并且我对它所需要的输入参数感到困惑。这是示例代码。start_scores = outputs.start_logits我无法理解变量start_positions & end_positions在模型中作为输入给出，以及正在生成的变量start_scores & end_scores。

浏览 7提问于2021-10-12得票数 2

回答已采纳

2回答

基于微调MLM的RoBERTa不提高性能

、、、、

我们采取了一些样本数据点(2M+) &精调罗伯塔基地(使用高频变压器)，使用蒙版语言建模(MLM)任务。我们做了4-5个周期(512序列长度，批大小=48)。使用余弦学习速率调度器(2-3周期/历元)由于RoBERTa模型是针对特定领域的数据进行细化的，因此我们确实期望该<

浏览 0提问于2023-04-18得票数 1

2回答

分段卷积神经网络/分段最大池的实现

、、

我目前正试图在Tensorflow中实现一个分段最大池操作，如所描述的那样。给出一个句子，我想把它分成三个不同的部分，最大将所有的部分分开，这样我就可以得到3个不同的值，而不是1。我还有另一个张量splits of shape [batch_len, 2]，其中任意行的第一个元素是拆分第一部分的索引，而第二个元素是拆分最后一部分的索引。我希望以一种基于training张量中提供的值索引</e

浏览 1提问于2017-11-16得票数 1

回答已采纳

1回答

机器学习实体评分(非识别)

、、、、

我正试图理解谷歌背后的机器学习部分。本文对它们的generate candidate entities模型作了如下说明。首先将给定的输入文本拆分为单词(基于空格分隔)，然后生成所有可能的最大长度单词子序列(在本例中为15个单词)，并根据每个候选文本是否代表有效实体，为每个候选对象分配一个值(介于0到1之间)：如果我的理解正确，模型会尝试句子中的每一个单词，以及这个单词的组

浏览 2提问于2020-02-26得票数 5

回答已采纳

2回答

减少BERT的推理时间

、、

我想进一步改进BERT的推理时间。{'input_ids': [], 'attention_mask': []} new_tokens = tokenizer.encode_plus(sentence, max_length=512

浏览 6提问于2021-09-15得票数 2

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

如何截断变压器库中的Bert令牌程序

用于命名实体识别的PyTorch Huggingface NLP

令牌索引序列长度大于此模型的指定最大序列长度(28627 >512个)

在大文本上微调GPT-2以生成域文本。

BERT嵌入层

拥抱面:如何使用bert-大-大在拥抱脸进行长文本分类？

用RNN学习词嵌入

我如何知道与预先训练的托卡器一起使用哪些参数？

使用像BERT这样的预训练模型进行文档分类

使用spacy v3，我应该更改配置文件中的哪个参数来解决CUDA内存不足的问题？batch_size对max_length对batcher.size

变压器(如伯特)是否有无限的输入尺寸？

使用encode_plus方法时令牌索引序列长度错误

如何使用Bert进行长文本分类？

面向长文档的集合式文档汇总

精密调谐曲面RobertaForQuestionAnswering的输入/输出格式

基于微调MLM的RoBERTa不提高性能

分段卷积神经网络/分段最大池的实现

机器学习实体评分(非识别)

减少BERT的推理时间

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐