为什么input_mask在BERT语言模型中都是相同的数字？_在使用sklearn模型转换用于训练和预测的数据时，如何确保所有数据都是相同的数字？_为什么我的随机森林分类器模型中每个决策树的max_depth都是相同的？ - 腾讯云开发者社区

tensorflow、nlp、bert-language-model、kaggle

为了更深入地了解NLP的工作原理，我在Kaggle浏览了一些笔记本。我偶然发现了一本自然语言推理任务的笔记本，用来预测给定的前提和假设之间的关系。它使用经过预先训练的BERT模型来完成这项任务。我有一个关于build_model()函数的问题： max_len = 50 def build_model(): bert_encoder = TFBertModel.from_pretrained("bert-base-multilingual-cased") input_word_ids = tf.keras.Input(shape=(max_len,), dtyp

浏览 7提问于2022-01-13得票数 0

回答已采纳

1回答

NotFoundError：[_Derived_]在Tensorflow 1.15.0上没有为op: StatefulPartitionedCall定义梯度

tensorflow、nlp

我正在使用嵌入层中的tensorflow运行BERT模型。我发现类似的问题没有答案。老实说，我不明白为什么会发生错误，因为模型对于另一个数据集运行良好。当我打电话给model.fit train_history = model.fit( train_input, train_labels, validation_split=0.2, epochs=3, batch_size=8 ) 我知道这个错误： NotFoundError: [_Derived_]No gradient defined for op: StatefulPartitionedCal

浏览 3提问于2020-07-20得票数 0

1回答

在TF2中从SavedModel获取操作

python、tensorflow、keras、tensorflow2.0

是否可以在已保存的模型中获得对内部操作的引用？我已经从tfhub下载了一个保存的模型，并在检查saved_model.pb文件后知道我需要哪个op。我想要获得一个对op的引用，这样我就可以在推断过程中记录值。更具体地说，我想从bert中提取op transformer/layer_1/dropout_5/dropout/Mul:z:0： max_seq_length = 128 input_word_ids = tf.keras.layers.Input(shape=(max_seq_length,), dtype=tf.int32,

浏览 0提问于2020-07-20得票数 0

1回答

在keras中用TF_HUB实现误码率测试

tensorflow、keras、neural-network、deep-learning、tf.keras

我试图使用tensorflow集线器在tensorflow-keras中实现Google Bert模型。为此，我设计了一个自定义的keras层"Bertlayer“。现在的问题是，当我编译keras模型时，它一直显示 AttributeError：“Bertlayer”对象没有属性“”_keras_style“” 我不知道我哪里错了，也不知道is.Please的哪个_keras_style属性有助于查找代码中的错误。这是指向完整代码的github链接： class BertLayer(tf.layers.Layer): def __init__(self, n_fine_tu

浏览 0提问于2019-05-30得票数 1

1回答

如何在tensorflow中使用transformers保存每个时期的最佳模型

python、tensorflow、nlp、huggingface-transformers

我使用了TFBertModel和Tensorflow模型来结合和训练拥抱的面部变形。我想保存每个时代的val_accuracy的最佳模型。我使用'tensorflow检查点‘，但我得到了error.How我是否可以保存每个时代的最佳模型与transformers在tensorflow？ from tensorflow.keras.callbacks import EarlyStopping from tensorflow.keras.initializers import TruncatedNormal from tensorflow.keras.losses import Cate

浏览 187提问于2021-06-19得票数 0

1回答

为什么伯特模型找不到一个与我输入的位置参数匹配的选项？

python、tensorflow、keras、nlp、bert-language-model

在尝试NLP练习时，我尝试使用BERT架构来获得一个好的训练模型。因此，我定义了一个函数，它使用BERT作为层来构建和编译模型。但是，在尝试执行函数并实际构建模型时，我会得到一个错误，即BERT层无法找到与我输入的位置参数匹配的选项。我的位置参数的维度是[None, 160]，但是伯特层似乎希望它们是[None, None]。我该怎么解决这个问题？为了重现我的问题：这些是我导入的库： import tensorflow as tf from tensorflow.keras.layers import Dense, Input from tensorflow.keras.optimize

浏览 5提问于2021-05-01得票数 1

2回答

内部错误:尝试在tf.GradientTape内部运行TF集线器时获取变量的渐变(或类似的)没有句柄数据。

python、tensorflow、keras、bert-language-model、tensorflow-hub

我试图在Tensorflow 2.4中的持久梯度磁带中训练 TF集线器模型。下面是我的代码的简化版本。 import tensorflow as tf import tensorflow_hub as hub input_mask = tf.keras.layers.Input(shape=4, dtype=tf.int32) input_word_ids = tf.keras.layers.Input(shape=4, dtype=tf.int32) input_type_ids = tf.keras.layers.Input(shape=4, dtype=tf.int32) bert

浏览 5提问于2021-03-24得票数 0

回答已采纳

2回答

在带有肋层的分配策略范围中没有创建变量。

python、tensorflow、keras、google-colaboratory、tpu

我试着用TPU来完成谷歌上的BERT模型。但我总是会遇到以下错误： 'bert_layer_module/bert/encoder/layer_10/attention/output/LayerNorm/beta:0‘：ValueError:变量(tf.Variable shape=(768，) dtype=float32)不是在0x7f6a1fad3390的(tensorflow.python.distribute.tpu_strategy.TPUStrategyV1对象的分发策略范围中创建的。这很可能是因为并非所有层或模型或优化器都是在分发策略范围之外创建的。试着确保您的代码看起

浏览 2提问于2019-08-02得票数 1

1回答

如何获取经过微调的TFBertModel的隐藏状态？

python、tensorflow、deep-learning、nlp、huggingface-transformers

我首先在文本分类任务中对Bert模型进行了微调，然后希望在TensorFlow中获得经过微调的模型的嵌入。不幸的是，我只能在第一行说output_hidden_states=True，在这里我下载了预先训练好的Bert模型，但在第二阶段我创建了一个tf.Keras.Model。下面是我如何制作和训练模型的代码： max_len = 55 from transformers import BertConfig, BertTokenizer, TFBertModel def build_custome_model(): bert_encoder = TFBertModel.from_p

浏览 29提问于2021-02-16得票数 1

回答已采纳

1回答

sparse_categorical_crossentropy()缺少两个必需的位置参数：“y_true”和“y_pred”

python、deep-learning、nlp、lstm、bert-language-model

我想使用Bert语言模型来训练多类文本分类任务。之前我使用LSTM训练，没有任何错误，但Bert给了我这个错误。我收到这个错误如下，我真的不知道如何解决它，谁能帮助我吗？不幸的是，在keras库中使用Bert的文档很少。错误： TypeError Traceback (most recent call last) <ipython-input-177-7b203e5e7f55> in <module>() 3 4 model.compile(optimizer = tf.ke

浏览 260提问于2021-04-11得票数 0

回答已采纳

3回答

在bert层中，池输出和序列输出有什么不同？

python-3.x、tensorflow、neural-network、text-classification、bert-language-model

所有人！我读到了关于Bert的文章，我想做文本分类和它的单词嵌入。我遇到了这一行代码： pooled_output, sequence_output = self.bert_layer([input_word_ids, input_mask, segment_ids]) 然后： clf_output = sequence_output[:, 0, :] out = Dense(1, activation='sigmoid')(clf_output) 但是我不明白集合输出的用法。不包含所有信息，包括“CLS”的单词嵌入，如果是，为什么我们有池输出？提前感谢！

浏览 3提问于2020-08-12得票数 1

回答已采纳

1回答

UnparsedFlagAccessError:在解析标志之前尝试访问标志--preserve_unused_tokens。伯特

python、nlp、bert-language-model

我想使用Bert语言模型来训练多类文本分类任务。之前我使用LSTM训练，没有任何错误，但Bert给了我这个错误。我收到这个错误如下，我真的不知道如何解决它，谁能帮助我吗？不幸的是，在keras库中使用Bert的文档很少。 !wget --quiet https://raw.githubusercontent.com/tensorflow/models/master/official/nlp/bert/tokenization.py import tensorflow_hub as hub from bert import tokenization module_url = 'ht

浏览 72提问于2021-04-11得票数 0

回答已采纳

1回答

内部错误:尝试在没有Tensorflow句柄数据的情况下获取变量的梯度(或类似值)

tensorflow、nlp、bert-language-model、tensorflow-hub、gradienttape

我正在使用Tensorflow为一个二进制情感分析类调整BERT。我想使用自定义训练循环/损失函数。然而，当我训练模型时，我得到了以下错误：ValueError: Internal error: Tried to take gradients (or similar) of a variable without handle data: Tensor("transformer_encoder/StatefulPartitionedCall:1019", shape=(), dtype=resource)。为了进行调试，我尝试将我的训练循环简化为只计算标准的二进制交叉熵，这应

浏览 27提问于2021-08-17得票数 0

1回答

如何提高我的迁移学习模型验证和测试的准确性

python、tensorflow、keras、transfer-learning、fine-tune

我训练了我的BERT模型，然后我得到了99%的培训部分--不管是谁，在部分验证中，我只得到了80%，那么如何提高我的验证精度呢？代码： def build_model(self, n_categories): input_word_ids = tf.keras.Input(shape=(self.MAX_LEN,), dtype=tf.int32, name='input_word_ids') input_mask = tf.keras.Input(shape=(self.MAX_LEN,), dtype=tf.int32, name='input_m

浏览 10提问于2022-08-29得票数 0

1回答

BERT文本分类

tensorflow、keras、deep-learning、bert-language-model

我是BERT新手，尝试通过coursera课程https://www.coursera.org/projects/fine-tune-bert-tensorflow/学习BERT文本分类微调基于本课程，我将分别使用'SGD‘和'ADAM’优化器比较BERT-12和BERT-24的文本分类性能。我发现当我使用BERT-12时，结果是正常的。然而，当切换到BERT-24时，虽然准确率很好(9X%)，但召回率和精确度极低(甚至接近于零)。我可以知道我的代码有什么问题吗？另外，为了提高精确度和召回率，我是否应该添加更密集的层并更改激活函数？我应该使用的最佳学习率值是多少？ i

浏览 12提问于2021-04-18得票数 1

回答已采纳

1回答

使用BERT进行多标签分类

python、tensorflow、classification、multilabel-classification

我想使用对Tensorflow进行多标签分类。为此，我想修改来自的示例，这是一个关于如何使用BERT来使用进行简单分类的示例。(例如使用BERT-Base, Cased) 我有不同的X标签，其值为0或1，所以我想在原始的BERT模型中添加一个新的大小为X的致密层，并使用sigmoid_cross_entropy_with_logits激活函数。所以，在理论上，我认为我还好。问题是，我不知道如何添加一个新的输出层，并使用现有的BertModel类仅用数据集重新训练这个新层。这里是来自run_classifier.py的最初的run_classifier.py函数，在这里我想我必须进行修改

浏览 0提问于2019-05-06得票数 9

回答已采纳

2回答

pytorch cnn model停在loss.backward()没有任何提示吗？

python、nlp、pytorch

我的目标是进行五类文本分类我正在使用cnnbase模型运行bert微调，但我的项目在loss.backward()停止，在cmd中没有任何提示。我的程序可以在lstm和rcnn等rnn base上成功运行。但是，当我运行某个cnnbase模型时，出现了一个奇怪的bug。我的cnn模型代码： import torch import torch.nn as nn import torch.nn.functional as F # from ..Models.Conv import Conv1d from transformers.modeling_bert import BertPreT

浏览 154提问于2019-12-09得票数 3

回答已采纳

1回答

分类度量不能处理多类和连续多输出目标的混合。

tensorflow、scikit-learn、one-hot-encoding、multiclass-classification

为了文本分类的目的，我正在multiclass数据集上运行一个经过预先训练的multiclass模型。因为它是多类的，所以我不知道如何生成classification report。我找到的解决方案是和。我理解，因为它是一个多类分类，所以我必须one-hot-encode test_y值(我确实这样做了)。 test_y = to_categorical(np.asarray(test_y.factorize()[0])) 但当我做的时候 from sklearn.metrics import classification_report print(classification_report(

浏览 8提问于2020-07-21得票数 1

1回答

通过删除不使用的层来微调BERT模型

python、tensorflow、keras、sentiment-analysis、bert-language-model

我在bert情感分析中发现了这段代码，其中删除了未使用的层，添加了更新可训练变量/可训练权重，我正在寻找显示BERT中不同层的文档，我们如何删除未使用的层，添加权重等。但是，我找不到任何相关文档。 BERT_PATH = "https://tfhub.dev/google/bert_uncased_L-12_H-768_A-12/1" MAX_SEQ_LENGTH = 512 class BertLayer(tf.keras.layers.Layer): def __init__(self, bert_path, n_fine_tune_encoders=10, **k

浏览 72提问于2021-09-20得票数 0

1回答

TensorFlow在密集输出层的输入形状误差与model.summary()所说的不一致

python、tensorflow、tf.keras、huggingface-transformers

我正在处理一个NLP问题(句子分类)，并决定使用HuggingFace的TFBertModel以及Conv1D、平面和密集层。我正在使用functional并编译我的模型。但是，在model.fit()期间，在输出密集层会出现形状错误。模式定义： # Build model with a max length of 50 words in a sentence max_len = 50 def build_model(): bert_encoder = TFBertModel.from_pretrained(model_name) input_word_ids = tf.ke

浏览 1提问于2020-08-22得票数 0

2回答

来自tfhub的BERT速度较慢且未使用GPU

python、tensorflow、keras、nlp、tensorflow2.0

我正在试用。遗憾的是，它的运行速度非常慢，根据Windows任务管理器的说法，它只使用了1-2%的GPU。我能做些什么来加快速度吗？ import tensorflow as tf import tensorflow_hub as hub tf.test.is_gpu_available(True) # returns True max_seq_length = 128 input_word_ids = tf.keras.layers.Input(shape=(max_seq_length,), dtype=tf.int32, name="input_word_ids"

浏览 5提问于2020-01-08得票数 1

1回答

如何保存和加载Python Keras BERT模型来序列化它？

python、keras、serialization、hdf5、bert-language-model

我刚刚完成了我的Keras BERT模型的训练，该模型处理多标签文本分类(百分比单位)，我希望能够将我的训练模型应用于新的(未标记的)文本。以下是我的模型的主要部分： class BertLayer(tf.keras.layers.Layer): def __init__( self, n_fine_tune_layers=10, pooling="first", bert_path="https://tfhub.dev/google/bert_uncased_L-12_H-768_A-12

浏览 0提问于2020-07-25得票数 0

1回答

如何通过TimeDistributed层使用bert层进行多实例学习？

tensorflow、keras、bert-language-model

我想使用Bert执行多实例学习。一包实例包含40个句子。每句话应该输出一个标签，最终的标签应该是所有标签的平均值。我试过使用tensorflow_hub的bert layer。但我不知道如何在TimeDistributed中使用它。 bert_layer = hub.KerasLayer("https://tfhub.dev/tensorflow/bert_en_uncased_L-12_H-768_A-12/1",trainable=True) pooled_output, sequence_output = bert_layer([input_word_ids, inp

浏览 24提问于2020-12-22得票数 1

2回答

保存“微调”的bert模型

python、tensorflow、machine-learning、machine-learning-model

我正在尝试保存一个调得很好的bert模型。我已经正确地运行了代码-它工作得很好，并且在ipython控制台中，我能够调用getPrediction并让它得到结果。我保存了我的权重文件(最高为model.ckpt-33.data-00000-of-00001 我不知道我将如何保存模型以供重用。我正在使用bert-tensorflow。 import json import pandas as pd import tensorflow as tf import tensorflow_hub as hub from datetime import datetime from sklear

浏览 281提问于2019-12-15得票数 2

1回答

EncoderDecoderModel转换解码器的分类器层

python、pytorch、huggingface-transformers

我正在尝试使用序列到序列模型进行命名实体识别.我的输出是简单的IOB标记，因此我只想预测每个令牌(IOB)的3个标签的概率。我正在尝试使用HuggingFace实现EncoderDecoderModel --使用DistilBert作为编码器，以BertForTokenClassification作为解码器。首先，我导入我的编码器和解码器： encoder = AutoModelForSequenceClassification.from_pretrained("distilbert-base-uncased") encoder.save_pretrained("E

浏览 2提问于2021-10-25得票数 1

回答已采纳

1回答

在TPUStrategy范围内使用BERT作为hub.KerasLayer编译模型失败

python、python-3.x、tensorflow、tensorflow2.0、tensorflow-hub

我正在尝试使用来自Keras集线器()的BERT多语言作为TensorFlow模型中的一个层。在不使用分发策略的情况下训练模型效果很好。但是，当尝试通过分发策略利用Google Cloud TPU时，训练模型失败，并出现以下错误： ValueError: Variable (<tf.Variable 'bert/embeddings/word_embeddings:0' shape=(119547, 768) dtype=float32>) was not created in the distribution strategy scope of (<tens

浏览 4提问于2020-01-08得票数 1

1回答

BERT模型的精调及向TF2的迁移

tensorflow、tensorflow2.0、bert-language-model、tensorflow-model-garden

我执行了这个优秀的教程：除了在哪里创建模型之外，我理解其中的大部分内容。我想知道它并迁移到TF2伯特。当说“基本上我们加载了预先训练过的模型，然后训练最后一层进行分类任务”，这是否意味着他冻结了所有其他层，并对最后一层进行了微调？这是我无法理解的相关代码(在TF1中)： def create_model(bert_config, is_training, input_ids, input_mask, segment_ids, labels, num_labels, use_one_hot_embeddings): """Creates a

浏览 0提问于2021-02-18得票数 0

1回答

为什么input_mask在BERT语言模型中都是相同的数字？

python、nlp、bert-language-model、nlu

对于文本分类任务，我应用了Bert(微调)，得到的输出如下:为什么input_mask都是1？ #to_feature_map is a function. to_feature_map("hi how are you doing",0) ({'input_mask': <tf.Tensor: shape=(64,), dtype=int32, numpy= array([1, 1, 1, 1, 1, 1, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,

浏览 52提问于2021-04-27得票数 0

回答已采纳

1回答

操作tensorflow代码以添加不同的层

python、tensorflow、keras、deep-learning、lstm

我正在试验BERT嵌入文本分类。我正在使用这个代码来创建一个BERT嵌入层和一个用于二进制分类的密集层。 # Initialize session sess = tf.Session() class PaddingInputExample(object): """Fake example so the num input examples is a multiple of the batch size. When running eval/predict on the TPU, we need to pad the number of examples

浏览 0提问于2020-01-15得票数 1

回答已采纳

2回答

BERT模型的训练和使用BERT嵌入

python、tensorflow、nlp、pytorch、bert-language-model

我一直在阅读BERT，并使用BERT嵌入进行分类任务。我读过很多文章，但我对它的理解仍然不是100% (我自学了NLP，所以我对资源的访问可能会受到一些限制)。首先，我将描述我的任务。我计划使用BERT嵌入进行分类，因为它是如何封装含义和语言的。不幸的是，在我的语言(爱尔兰语)中没有伯特模型，所以我研究了自己的训练。我知道伯特基本上是变压器编码器的“延伸”。以下是我的问题：我认为这是相当明显的，但是要检查的是，预先训练过的BERT嵌入不能应用于不同的语言(标准的嵌入模型是在wiki数据集上为英语训练的，我认为由于明显的原因，它不可能在其他语言上使用)？我的数据集包含了关

浏览 17提问于2020-08-18得票数 2

1回答

如何为不同的语言创建自定义的BERT语言模型？

nlp、bert-language-model

我想要创建一个使用转换器的语言翻译模型。然而，Tensorflow似乎只有一个用于英语的BERT模型。如果我想要另一种语言的BERT，实现这一点的最好方法是什么？我应该创建一个新的BERT，还是可以在另一种语言上培训Tensorflow自己的BertTokenizer？

浏览 1提问于2022-05-30得票数 2

1回答

毕氏交叉熵输入维数

python、pytorch、python-3.7、cross-entropy、huggingface-transformers

我正在尝试开发一个二进制分类器，它包含Huggingface的BertModel和Py手电筒。分类器模块如下所示： class SSTClassifierModel(nn.Module): def __init__(self, num_classes = 2, hidden_size = 768): super(SSTClassifierModel, self).__init__() self.number_of_classes = num_classes self.dropout = nn.Dropout(0.01) self.hidden_size =

浏览 2提问于2020-04-03得票数 0

回答已采纳

1回答

如何使用从save_weights中保存的tensorflow模型来加载和预测？

python、tensorflow、keras、deep-learning、nlp

我正在运行一个相当定制的tensorflow模型，它来自以下回购系统： # Initialize session sess = tf.Session() # # Load all files from a directory in a DataFrame. # def load_directory_data(directory): # data = {} # data["sentence"] = [] # data["sentiment"] = [] # for file_path in os.listdir(direc

浏览 2提问于2020-02-04得票数 2

回答已采纳

1回答

对自定义数据进行BERT的细化

tensorflow、deep-learning、nlp、text-classification、bert-language-model

我想训练一个21级文本分类模型使用Bert。但是我的训练数据很少，所以下载了一个与5类类似的数据集，包含200万个样本。验证准确率达98%左右。现在，我想使用这个模型作为我的小定制数据的预训练模型。但是我得到了shape mismatch with tensor output_bias from checkpoint reader错误，因为检查点模型有5个类，而我的自定义数据有21个类。 NFO:tensorflow:Calling model_fn. INFO:tensorflow:Running train on CPU INFO:tensorflow:*** Features ***

浏览 0提问于2019-05-04得票数 3

1回答

用于QuestionAnswering输入的伯特超过512个

bert、transformer、question-answering、huggingface

我正在训练bert回答问题(西班牙语)，我有一个很大的上下文，只有超过512的上下文，总问题+上下文是10k，我发现长语句就像用于长文档的Bert一样，但是没有经过西班牙语的预培训，所以，有没有办法绕过bert。我试过的是： from transformers import BertConfig config=BertConfig.from_pretrained(BERT_MODEL_PATH) config.max_length=4000 config.max_position_embeddings=4000 config.output_hidden_states=True model

浏览 0提问于2020-09-14得票数 4

回答已采纳

1回答

使用非英语文本的预训练模型的BERT句子嵌入

python、nlp、cosine-similarity、bert-language-model、sentence-similarity

我正在尝试应用BERT句子嵌入来从瑞典语文本字符串语料库中查找给定瑞典语文本片段的相似句子。来自sentence_transformers (SBERT)的句子BERT似乎是理想的选择。他们有各种预先训练的模型，并给出了很好的例子：() from sentence_transformers import SentenceTransformer, util import torch embedder = SentenceTransformer('distilbert-base-nli-stsb-mean-tokens') sentences = ['This fram

浏览 8提问于2020-10-29得票数 0

1回答

如何在Tensorflow模型中添加文本预处理标记化步骤

tensorflow、machine-learning、deep-learning、data-preprocessing

我有一个TensorFlow模型SavedModel，其中包括saved_model.pb和variables文件夹。预处理步骤还没有包含到这个模型中，这就是为什么我需要在将数据输入到预测方面的模型之前进行预处理(Tokenization等)。我正在寻找一种方法，我可以结合预处理步骤到模型。我见过和的例子，但是它们是图像数据。为了了解培训部分是如何完成的，这是我们进行培训的代码的一部分(如果您需要实现我在这里使用的函数，请告诉我(我没有包括它以使我的问题更容易理解)) 培训： processor = IntentProcessor(FLAGS.data_path, FLAGS.test_d

浏览 13提问于2022-07-13得票数 3

回答已采纳

1回答

如何提高BERT keras hub层输入的秩(ndim)以进行学习排名

python、keras、information-retrieval、bert-language-model、tensorflow-hub

我正在尝试使用tensorflow集线器上提供的预训练BERT来实现一个学习排名模型。我使用的是ListNet损失函数的一个变体，它要求每个训练实例都是与查询相关的几个排序文档的列表。我需要模型能够接受形状(batch_size，list_size，sentence_length)中的数据，其中模型在每个训练实例的'list_size‘轴上循环，返回排名并将它们传递给损失函数。在一个只包含密集层的简单模型中，通过增加输入层的维度很容易做到这一点。例如： from tensorflow.keras.layers import Dense, Input from tensorflow.ke

浏览 31提问于2021-05-16得票数 1

2回答

在小型定制语料库上预训练语言模型

deep-learning、transfer-learning、huggingface-transformers、language-model、bert-language-model

我很好奇是否可以在文本生成中使用迁移学习，并对特定类型的文本进行再培训/预训练。例如，有一个经过预先训练的BERT模型和一个小型的医学语料库(或任何“类型”)文本，就可以生成一个能够生成医学文本的语言模型。假设你没有大量的“医学文本”，这就是为什么你必须使用转移学习。我把它说成是一条管道，我把它描述为：使用经过预先训练的伯特装置。从我的新文本中获取新的标记，并将它们添加到现有的经过预先培训的语言模型中(例如，vanilla BERT)。使用组合标记器在自定义语料库上重新训练预训练的BERT模型。在小型定制语料库中生成类似于文本的文本。这听起来耳熟吗？抱着脸

浏览 5提问于2020-04-24得票数 7

2回答

理解python中的嵌套函数

python、tensorflow、nested-function

我有以下嵌套函数代码： def function1(req): def inner_func(username): if username == 'Admin': return "'{0}' can access to {1}.".format(username, req) else: return "'{0}' cannot access to {1}.".format(username, req) return i

浏览 0提问于2019-07-26得票数 1

回答已采纳

1回答

BERT不将我自己的R函数导出到Excel

excel

我有一个关于BERT导出函数到excel的问题。我已经下载了BERT (2.4.4.)，在excel中可以看到这个插件，我可以打开它。但是，当我用R编写一些代码时(例如，如果我将一些函数放在BERT的functions.r文件夹中)，除非我自动编写BERT源代码，否则我无法使用它们。我想创建一个excel应用程序，它可以通过点击一个宏按钮来工作，这就是为什么打开BERT控制台是非常不切实际的原因。如果我自己编写的函数可以导出到excel，我想我可以随时使用它们，但它们不是，甚至不是来自BERT文件函数的TestAdd。r。

浏览 11提问于2020-07-01得票数 0

1回答

BERT输出不确定

deep-learning、nlp、transformer、bert-language-model

BERT输出不是确定性的。我希望当我输入相同的输入时，输出值是确定的，但我的bert模型的输出值正在变化。听起来很别扭，相同的值返回两次，一次。也就是说，一旦出现另一个值，同样的值也会出现并重复。如何使输出具有确定性？让我展示一下我的代码片段。我使用下面的模型。对于BERT实现，我使用huggingface实现的BERT pytorch实现。这是pytorch领域中非常著名的模型ri实现。link tokenizer = BertTokenizer.from_pretrained(self.bert_type, do_lower_case=self.do_lower_cas

浏览 75提问于2019-06-18得票数 6

回答已采纳

1回答

BERT至XLNET列车模型

python、tensorflow、nlp、tf.keras、transformer-model

我试图在XLNet中做这样的事情，但是我在文档中找不到这个部分，任何帮助都是有价值的，谢谢！ # we access the transformer model within our bert object using the bert attribute # (eg bert.bert instead of bert) embeddings = bert.bert(input_ids, attention_mask=mask)[1] # access pooled activations with [1] (而不是bert.bert，我试图用xlnet来实现它)

浏览 7提问于2021-05-17得票数 0

回答已采纳

1回答

针对不同语言的特定领域微调BERT？

python-3.x、deep-learning、nlp、bert-language-model

我想对一个预先训练好的BERT模型进行微调。但是，我的任务使用特定领域内的数据(比如生物医学数据)。此外，我的数据也是一种不同于英语的语言(比如荷兰语)。现在，我可以微调荷兰bert-base-荷兰案例预训练模型。然而，我该如何对生物医学BERT模型进行微调，比如BioBERT，它属于正确的领域，但语言错误？我曾经考虑过使用NMT，但我不认为它是可行的，也不值得为此付出努力。如果我在没有对模型进行任何更改的情况下进行微调，我担心模型不会很好地学习任务，因为它是在完全不同的语言上预先训练的。

浏览 4提问于2021-01-28得票数 2

2回答

多语种Bert语句向量捕获的语言比意义更多-作为实习？

python、deep-learning、pytorch、multilingual、bert-language-model

在Bert的游戏中，我下载了Huggingface多语种BERT，输入了三个句子，保存了它们的句子向量(嵌入[CLS])，然后通过Google翻译翻译它们，通过模型传递它们，保存它们的句子向量。然后，我用余弦相似度比较了结果。我惊讶地发现，每个句子向量与从它翻译出来的句子(0.15-0.27余弦距离)相当远，而来自同一语言的不同句子确实非常接近(0.02-0.04余弦距离)。因此，与其将意义相似的句子(但不同的语言)组合在一起(在768维空间中; )，同一语言的不同句子更接近。据我所知，多语种Bert的全部要点是跨语言迁移学习--例如，培训一种语言的表示模型(例如，和FC网)，并使该模

浏览 4提问于2020-01-06得票数 3

回答已采纳

1回答

用BERT (TF 1.x)保存的模型进行推理

tensorflow、tensorflow-serving、tensorflow-estimator

我被困在一行代码上，因此整个周末都在一个项目上陷入停顿。我正在做一个使用BERT进行句子分类的项目。我已经成功地训练了模型，我可以使用run_classifier.py的示例代码来测试结果。我可以使用此示例代码导出该模型(该代码已多次重新发布，因此我认为该模型是正确的)： def export(self): def serving_input_fn(): label_ids = tf.placeholder(tf.int32, [None], name='label_ids') input_ids = tf.placeholder(tf.int32, [

浏览 3提问于2020-04-19得票数 3

1回答

使用不同语言的数据集从DeepPavlov重新训练多语言NER模型(Ner_ontonotes_bert_mult)

nlp、named-entity-recognition、pre-trained-model、deeppavlov

我已经成功安装了来自DeepPavlov(ner_ontonotes_bert_mult)的多语言NER模型。我想用阿尔巴尼亚language.Is中的新数据(与他们在页面中建议的格式相同)重新训练这个模型(用不同语言的数据从DeepPavlov重新训练多语言NER模型)，或者只有在我们有英语数据的情况下才能进行重新训练？？

浏览 33提问于2021-05-21得票数 1

回答已采纳

1回答

通过Huggingface转换器更新BERT模型

tensorflow、nlp、pytorch、spacy、huggingface-transformers

我正在尝试使用内部语料库更新预训练的BERT模型。我看过Huggingface的transformer文档，你会发现我有点困惑，below.My的目标是使用余弦距离计算句子之间的简单相似度，但我需要为我的特定用例更新预先训练的模型。如果你看一下下面的代码，这正是Huggingface文档中的代码。我试图“重新训练”或更新模型，我假设special_token_1和special_token_2表示来自我的“内部”数据或语料库的“新句子”。这是正确的吗？总而言之，我喜欢已经预训练的BERT模型，但我想使用另一个内部数据集来更新或重新训练它。任何线索都将不胜感激。 import tensorfl

浏览 53提问于2019-10-30得票数 9

1回答

将PyTorch转换为ONNX模型会增加ALBert的文件大小

python、pytorch、onnx、quantization、onnxruntime

目标:使用这个对albert-base-v2模型执行量化。内核：conda_pytorch_p36. 第1.2和2.2节中的输出显示：将香草BERT从PyTorch转换为ONNX，保持相同大小的，417.6 MB。量化模型的比香草BERT、PyTorch 173.0 MB和ONNX 104.8 MB小。但是，当运行ALBert时 PyTorch和ONNX模型的尺寸是不同的。量化模型尺寸比香草大。我认为这是模型性能较差的原因，与香草ALBert相比，ALBert的两种量化ALBert方法的模型性能都较差。 PyTorch： Size (MB): 44

浏览 35提问于2022-01-20得票数 0

回答已采纳

1回答

在bert上训练新数据集

python、tensorflow、nlp、tokenize、bert-language-model

我是新来伯特的我有一个amazon评论数据集，我想要根据评论预测星级我知道我可以使用预先训练好的bert模型，如here所示但我想在我自己的数据集上训练bert模型。这就是here正在做的事情吗？我是否可以在任何数据集的预训练模型上应用这种“微调”，以获得更准确的结果，或者我是否必须做一些其他事情来从头开始训练模型如果我确实想从头开始训练一个模型，我应该从哪里开始呢？

浏览 61提问于2021-10-03得票数 0