在tensorflow的`BERT`中使用`keras.Model.fit`时，维度不匹配

在TensorFlow的BERT中使用keras.Model.fit时，维度不匹配通常是由于输入数据的形状与模型的期望输入形状不一致导致的。

BERT模型是一个预训练的自然语言处理模型，它接受的输入是经过特定处理的文本数据。在使用keras.Model.fit训练BERT模型时，需要确保输入数据的形状与模型的期望输入形状一致。

首先，需要明确BERT模型的输入形状。BERT模型的输入通常由三个部分组成：输入词汇ID（input_ids）、输入段落ID（input_segment_ids）和输入词汇位置ID（input_mask）。这些输入都是二维张量，其中input_ids和input_segment_ids的形状是[batch_size, sequence_length]，input_mask的形状是[batch_size, sequence_length]。

当使用keras.Model.fit时，需要将输入数据按照模型的期望形状进行处理。假设你的输入数据是一个包含N个样本的列表，每个样本是一个文本字符串。首先，需要将文本字符串转换为对应的词汇ID序列，可以使用tokenizer将文本转换为词汇ID。然后，需要将词汇ID序列进行填充或截断，使其长度与sequence_length一致。接下来，可以创建input_ids、input_segment_ids和input_mask三个输入张量。

例如，使用TensorFlow的Tokenizer对文本进行处理：

import tensorflow as tf
from transformers import BertTokenizer

tokenizer = BertTokenizer.from_pretrained('bert-base-uncased')

# 假设你的输入数据是一个包含N个样本的列表，每个样本是一个文本字符串
texts = ['Hello, how are you?', 'I am fine, thank you.']

# 将文本转换为词汇ID序列
input_ids = [tokenizer.encode(text, add_special_tokens=True) for text in texts]

# 填充或截断词汇ID序列，使其长度与sequence_length一致
input_ids = tf.keras.preprocessing.sequence.pad_sequences(input_ids, maxlen=sequence_length, padding='post', truncating='post')

# 创建input_ids、input_segment_ids和input_mask三个输入张量
input_ids = tf.constant(input_ids)
input_segment_ids = tf.zeros_like(input_ids)
input_mask = tf.ones_like(input_ids)

# 构建模型
model = create_bert_model()

# 使用keras.Model.fit训练模型
model.fit(x=[input_ids, input_segment_ids, input_mask], y=labels, batch_size=batch_size, epochs=epochs)

在上述代码中，需要根据实际情况设置sequence_length、labels、batch_size和epochs等参数。另外，create_bert_model()需要根据具体的模型架构进行实现。

总结一下，当在TensorFlow的BERT中使用keras.Model.fit时，维度不匹配通常是由于输入数据的形状与模型的期望输入形状不一致导致的。需要根据BERT模型的输入形状，将输入数据转换为对应的形状，并确保维度匹配。

在tensorflow的`BERT`中使用`keras.Model.fit`时，维度不匹配

、、、、

我遵循的指示，用我自己的数据集(它有点大，大于20G)构建一个模型，然后采取步骤重新创建我的数据并从tf_record文件中加载它们。我创建的training_dataset与指令中的签名相同The resulting tf.data.Datasets return (feature

浏览 23提问于2021-03-05得票数 0

回答已采纳

1回答

如何提高BERT keras hub层输入的秩(ndim)以进行学习排名

、、、、

我正在尝试使用tensorflow集线器上提供的预训练BERT来实现一个学习排名模型。我使用的是ListNet损失函数的一个变体，它要求每个训练实例都是与查询相关的几个排序文档的列表。我需要模型能够接受形状(batch_size，list_size，sentence_length)中的数据，其中模型在每个训练实例的'list_size‘轴上循环，返回排名

浏览 31提问于2021-05-16得票数 1

8回答

无法导入bert.tokenization

、、

我使用的是Google，下面的导入不知何故不起作用：我得到了这个错误：我试图通过运行以下命令来安装bert：知道如何解决这个错误吗？

浏览 8提问于2019-06-12得票数 11

回答已采纳

2回答

为什么在pip安装bert后无法在bert中导入函数

、、

我是bert的初学者，我正在尝试使用GitHub上给出的bert文件：import bert

浏览 3提问于2019-06-12得票数 6

回答已采纳

1回答

为什么伯特模型找不到一个与我输入的位置参数匹配的选项？

、、、、

在尝试NLP练习时，我尝试使用BERT架构来获得一个好的训练模型。因此，我定义了一个函数，它使用BERT作为层来构建和编译模型。但是，在尝试执行函数并实际构建模型时，我会得到一个错误，即BERT层无法找到与我输入的位置参数匹配的选项。我的位置参数的维度是[None, 160]，但是伯特层似乎希望它们是[None

浏览 5提问于2021-05-01得票数 1

4回答

bert-serving start给出错误TypeError:无法解包不可迭代的bert对象-已尝试多条指向模型的路径

、、

我尝试在python3.8中使用BERT和bert-serving-start，但是它没有初始化并抛出错误：这可能与路径未被识别有关，但我按照以下说明操作：C:\Users\g\PycharmProjects\Project1\cased_L-12_H-768_A-12\cased_L-12_H-768_A-12 如果在命

浏览 1提问于2020-06-11得票数 3

2回答

将tensorflow BERT检查点转换为pytorch的错误

、、

我下载了特定于域的bert模型的tensorflow检查点，并将压缩文件解压缩到包含以下三个文件的文件夹pretrained_bert中 model.ckpt.meta import torch from pytorch_transformers.modeling_<em

浏览 1提问于2019-08-19得票数 1

2回答

在图形中运行keras.Models.fit()

、、

如何在图中运行keras.model.fit()而不是立即执行...？？我试图使用tf.compat.v1.disable_eager_execution()在图中运行我的模型，但返回的代码错误: numpy必须以急切的执行方式运行错误出现在检查点模型之后我使用的是tensorflow

浏览 22提问于2020-04-20得票数 2

回答已采纳

1回答

Python超分辨率Keras问题

、

我有一个我无法解决的问题。我刚刚接近Python上的超级分辨率图像，我在github上找到了这个：我想这正是我的项目所需要的。因此，我只需安装运行它所需的一切，并使用以下命令运行它: python main.py (path)t1.bmppython\t1.bmp

浏览 1提问于2017-05-28得票数 0

4回答

导入伯特错误:模块'tensorflow._api.v2.train‘没有属性’优化器‘

、、、

我试图在Google中使用bert-tensorflow，但是我得到了以下错误：跟踪(最近一次调用) in () 1 import ->2来自bert import run_classifier_with_tfhub在() 85 86 -> 87类AdamWeightDecayOptimizer(tf.train.Optimizer)：88“-一个基本的Adam优化器中，包含”正确的“L2重量衰减”89“。Attrib

浏览 5提问于2020-04-16得票数 6

回答已采纳

5回答

与tensorflow一起使用的keras版本-GPU1.4

、、、、

我正在使用ubuntu 16，与python 3，tf-GPU与角.我被降级为TF-1.4，因为解释了库达的错误似乎这是一个在tensorflow和新角是不适合旧的我找不到与TF1.4GPU一起使用的正确的keras版本。什么是正确的？

浏览 1提问于2018-08-15得票数 16

1回答

如何从TF集线器获取Bert标记器的vocab文件

、、、

我正在尝试使用来自TensorFlow集线器的Bert并构建一个记号赋予器，这就是我正在做的：>>> from bert.tokenizationimport FullTokenizer >>> BERT_URL = 'https://tfhub.dev/tensorflow</em

浏览 1提问于2020-01-09得票数 1

1回答

运行run_squad.py对Google BERT模型进行微调时，无法加载(恢复) TensorFlow检查点(官方tensorflow预训练模型)

、、

我是深度学习和自然语言处理的新手，现在正试图开始使用预先训练好的Google BERT模型。因为我打算用BERT构建一个QA系统，所以我决定从SQuAD相关的微调开始。我在the official Google BERT GitHub repository中遵循了README.md的说明。我输入的代码如下： export BERT_BASE_DIR=/home/

浏览 161提问于2019-04-06得票数 1

1回答

tensorflow.org的tensorflow示例中的官方模块

、、、

我一直在关注tensorflow教程https://www.tensorflow.org/official_models/fine_tuning_bert 在第一个代码片段中，我看到了很多来自官方模块的导入import numpy as np import tensorflow_h

浏览 39提问于2020-06-30得票数 1

1回答

Google Colab GPU不可用(tensorflow* & keras tf-models错误)*

、、、

几天前，我用Google Colab Pro写了一个用于文本分类的BERT模型。一切都很好，但从昨天开始，我总是得到"GPU不可用“的输出。我没有改变任何东西，但是注意到在安装tensorflow_hub和keras tf-model时发生了错误。以前没有出现过任何错误。!pip install keras tf-models-official pydot graphviz错误: tens

浏览 0提问于2021-05-21得票数 0

1回答

keras-伯特load_trained_model_from_checkpoint错误

、、

我有一段代码用于加载一个执行良好的BERT模型，但现在它引发了一个错误。load_trained_model_from_checkpoint( config_path、checkpoint_path、trainable=True、seq_len=SEQ_LEN、output_layer_num=4 )AttributeError：'tuple‘对象没有属性'layer’keras-bert=0.85.0tensorflow</e

浏览 5提问于2022-02-03得票数 0

1回答

使用Tensorflow-Hub和Colab TPU时出错

、、、、

我正在尝试使用Tensorflow集线器使用BERT进行文本分类。代码在Colab GPU上运行良好，但当我将其转换为Colab TPU时，它显示以下'uninitialized layer‘错误。compute_output_shape(self, input_shape): return (input_shape[0], self.output_size) 以下是我的模型： print("---------------

浏览 77提问于2019-06-05得票数 1

2回答

Python regex，用于提取带有+符号的单词

、、

我们有文本作为 "Google and Bert+Amazon+Alexa' 预期的输出是，当我们将搜索文本作为Google和Bert传递时，输出应该是"Google和Bert“，而当输入的搜索词是Google时，它应该不匹配。需要匹配到完整的文本，该文本可以在符号"+“之前或之间或之后 pattern = r'(?:^|\+)&

浏览 13提问于2019-09-17得票数 2

1回答

基于BERT和Tensorflow* 2的多标签文本分类*

、、、、

我正在尝试使用BERT建立一个简单的多标签文本分类管道；目标是对社交媒体帖子的内容进行分类，任何帖子都可以有多个标签(即，一篇文章可以被标记为“药物”和“身心健康”)。我对伯特非常陌生，并试图效仿我发现的这个例子：，我有一些关于如何为这个任务设置它的问题。在我的Anaconda系统中，我以前安装了Tensorflow 2.0版本。我已经运行了命令"pip install bert-

浏览 16提问于2022-06-14得票数 0

1回答

面向初学者的BERT文本分类任务

、、、

有人可以简单地列出为CS新手构建BERT文本分类器所涉及的任务吗？我的方法包括获取一个段落长度的人道主义援助活动描述列表(在CSV文件中具有相应的标题和扇区代码)，并使用单独的扇区代码列表及其句子长描述构建一个能够将扇区代码分配给描述的分类器。对于训练、测试和评估，我将把我的分类器生成的代码与CSV文件中的代码进行比较。有什么关于高级任务/步

浏览 15提问于2021-11-12得票数 0

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

在tensorflow的`BERT`中使用`keras.Model.fit`时，维度不匹配

相关·内容

在tensorflow的`BERT`中使用`keras.Model.fit`时，维度不匹配

如何提高BERT keras hub层输入的秩(ndim)以进行学习排名

无法导入bert.tokenization

为什么在pip安装bert后无法在bert中导入函数

为什么伯特模型找不到一个与我输入的位置参数匹配的选项？

bert-serving start给出错误TypeError:无法解包不可迭代的bert对象-已尝试多条指向模型的路径

将tensorflow BERT检查点转换为pytorch的错误

在图形中运行keras.Models.fit()

Python超分辨率Keras问题

导入伯特错误:模块'tensorflow._api.v2.train‘没有属性’优化器‘

与tensorflow一起使用的keras版本-GPU1.4

如何从TF集线器获取Bert标记器的vocab文件

运行run_squad.py对Google BERT模型进行微调时，无法加载(恢复) TensorFlow检查点(官方tensorflow预训练模型)

tensorflow.org的tensorflow示例中的官方模块

Google Colab GPU不可用(tensorflow* & keras tf-models错误)*

keras-伯特load_trained_model_from_checkpoint错误

使用Tensorflow-Hub和Colab TPU时出错

Python regex，用于提取带有+符号的单词

基于BERT和Tensorflow* 2的多标签文本分类*

面向初学者的BERT文本分类任务

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐