如何使用TFBertModel的隐藏状态作为自定义Keras模型的一部分？_使用Keras模型作为闪亮应用程序的一部分_使用隐藏层输出作为目标的一部分的Keras自定义损失函数 - 腾讯云开发者社区

tensorflow、machine-learning、keras、sentiment-analysis、bert-language-model

当我试图微调一个bert模型来预测情绪分析时，我得到了下一个错误。I用作输入:x-包含tweet y的字符串列表-一个数字列表(0 -负，1-正)用作输入的文本是由tweet组成的字符串列表，用作输入的标签是类别列表

浏览 4提问于2022-05-18得票数 0

回答已采纳

1回答

如何使用TFBertModel的隐藏状态作为自定义Keras模型的一部分？

python、tensorflow、keras、huggingface-transformers

我想使用bert的hidden_states作为下一层的输入，并使用keras.Model构建它。但是bert只返回最后一层和池的输出。下面是我尝试过的代码： def _def_input(): input_ids = Input(batch_shape=(None, 256), name='input_ids', dtype=config = BertConfig.from_pretrained("bert-ba

浏览 20提问于2020-07-27得票数 1

1回答

保存包装在Keras中的模型

python-3.x、tensorflow2.0、huggingface-transformers

对于我天真的问题，我很抱歉，但我正在尝试保存我的keras model ()，在这个模型中，我使用TFBertModel()函数作为隐藏层。为此，我使用tf.keras包提供的save()函数。---> 1 model.save('model_weights.h5') /tensorflow-2.1.0/python3.6/tensorfl

浏览 6提问于2020-02-05得票数 3

1回答

使用huggingface包中的XLNet转换器训练模型

python、tensorflow、keras、huggingface-transformers

我希望在模型中包含一个预先训练好的XLNet (或者可能是另一个最先进的转换器)来对其进行微调。但是，当我将它包含在keras层中时，它就不起作用了。bug是 AttributeError: 'NoneType' object has no attribute 'shape' 在一线上 x = xlnetPretrainedModel(x) 因此，当模型用于输入层时如果在numpy数组上使用，XLNet模型可以工作，但是我就不能

浏览 52提问于2020-12-22得票数 2

1回答

有没有办法将bert-large用作文本分类工具而无需微调？

python、tensorflow、keras、nlp、bert-language-model

我目前的一个任务是将任何文本分类问题的基于keras BERT的模型转换为.pb文件。为此，我已经有了一个函数，它接受keras模型，但重点是，当我试图下载任何预训练版本的BERT时，它们总是没有任何用于分类的顶层，因此我应该在BERT之前手动添加tf.keras.layers.Input我的最终目标是摆脱微调的需要，并获得一些已经进行了微调的现成模型</

浏览 1提问于2021-04-06得票数 0

1回答

TypeError:层的输入应该是张量。Got: last_hidden_state

python、tensorflow、huggingface-transformers、bert-language-model

我一直在尝试使用BERT训练句子相似度模型，但我遇到了这个错误。我确实找遍了，但找不到解决方案，有人能帮我吗？附加代码供您参考。bert_model = transformers.TFBertModel.from_pretrained("bert-base-uncased") tf.keras.layers.LSTM(64, retur

浏览 44提问于2021-11-19得票数 -1

1回答

向Huggingface转换器添加额外的层

python、tensorflow、keras、nlp、huggingface-transformers

我想在预先训练好的TFDistilBertModel，TFXLNetModel和TFRobertaModel Huggingface模型之后添加额外的Dense层。我已经了解了如何使用TFBertModel实现这一点，例如output = output[1] output= tf.keras.layers.Dense(32,activation='relu&#x

浏览 4提问于2020-08-01得票数 4

回答已采纳

1回答

如何获取经过微调的TFBertModel的隐藏状态？

python、tensorflow、deep-learning、nlp、huggingface-transformers

我首先在文本分类任务中对Bert模型进行了微调，然后希望在TensorFlow中获得经过微调的模型的嵌入。不幸的是，我只能在第一行说output_hidden_states=True，在这里我下载了预先训练好的Bert模型，但在第二阶段我创建了一个tf.Keras.Model。下面是我如何制作和训练模型的代码： from transformers import BertC

浏览 29提问于2021-02-16得票数 1

回答已采纳

1回答

如何将初始隐藏状态传递给lstm层？

python、python-3.x、tensorflow、lstm、tensorflow2.0

我想向lstm输出传递一个自定义的初始状态，但是我只有一个隐藏状态，那么如何传递一个零的初始状态呢？from tensorflow.keras import layers x = layers.Embedding(....)(x)imp_vec = Dense()(x) 现在，我想使用imp_vec作为</

浏览 11提问于2020-01-13得票数 4

回答已采纳

1回答

创建CoreML LRCN模型

python、ios、keras、recurrent-neural-network、coreml

我最近发布了一个问题，这个问题与我正在做的这个项目的一部分有关，它很容易得到解决；然而，随着我进一步深入这一努力，我发现自己不明白这个模型的一部分是如何实现的。首先，我在Keras中使用Tensorflow后端构建了一个模型，该模型在时间分布式包装器中使用卷积层。在卷积部分之后，单个LSTM层连接到密集层作为输出。不是那么简单(至少对我来说)，是如何</e

浏览 7提问于2018-01-29得票数 3

回答已采纳

1回答

如何在HuggingFace变压器库中获取预训练的BERT模型的中间层输出？

tensorflow、keras、tensorflow2.0、huggingface-transformers、bert-language-model

(我正在学习关于BERT word嵌入的 author教程，在本教程中，作者访问了BERT模型的中间层。)我想要的是使用HuggingFace的Transformers库访问TensorFlow2中BERT模型的单个输入令牌的最后4层。因为每个层输出一个长度为768的向量，所以最后4个层的形状为4*768=3072 (对于每个令牌)。如何在TF/keras</e

浏览 8提问于2020-04-27得票数 7

回答已采纳

1回答

科拉斯(TF)怎么知道如何区分我的习惯损失？

keras、tensorflow、loss-function

假设我有这个习惯上的损失：keras (以TF为后端)如何知道如何区分输入，而忽略作为系数的它是用数字计算出来的吗？如果是这样的话，这是否与其自身的

浏览 0提问于2019-10-07得票数 2

2回答

tf.keras.models.save_model和优化器警告

python、tensorflow、optimization、machine-learning、keras

我使用序列模型创建了一个tf.keras，如下所示：model.add(tf.keras.layers.Dense(8, input_dim我不明白为什么，因为我把优化器作为model.compile的一部分 model, overwrit

浏览 4提问于2018-07-09得票数 5

回答已采纳

3回答

Keras -如何获得非规范化逻辑而不是概率

python、machine-learning、keras、neural-network、nlp

我正在用Keras创建一个模型，并希望计算我自己的度量(困惑)。这需要使用未规范化的概率/逻辑。然而，keras模型只返回softmax概率：model.add(embedding_layer) model.add(LSTM(n_hidden, return_sequences然而，这些答案将中间输出存储在另一个模型中，这不是我所需要的。我想用日志作为我的

浏览 5提问于2017-10-31得票数 11

回答已采纳

1回答

TensorFlow在密集输出层的输入形状误差与model.summary()所说的不一致

python、tensorflow、tf.keras、huggingface-transformers

我正在处理一个NLP问题(句子分类)，并决定使用HuggingFace的TFBertModel以及Conv1D、平面和密集层。我正在使用functional并编译我的模型。model with a max length of 50 words in a sentencedef build_model(): bert_encoder = TFBertModel.from_pretrained_______________________

浏览 1提问于2020-08-22得票数 0

2回答

我是否可以使用下一层的输出作为Keras当前层的输入？

neural-network、nlp、keras、lstm

在文本生成任务中，通常使用模型的最后一个输出作为当前输入来生成下一个单词。更一般化，我想实现一个神经网络，它将下一层的最终隐藏状态作为当前层的输入。就像下面这样(让我困惑的是解码器部分)：但是我读过Keras文档，没有找到实现它的任何功能。我能通过Keras实现这个结构吗？多么?

浏览 2提问于2017-03-05得票数 5

回答已采纳

1回答

如何保存和重新加载Keras编解码模型的隐藏状态以进行推理

python-3.x、keras、nlp、lstm、seq2seq

我正在研究一个序列，使用在Keras中使用LSTM层的编码器解码器架构来对文本生成进行序列排序。我的代码是Keras seq2seq教程：的修改版本。在对模型进行训练之后，我想建立一个推理模式，在这种模式下，我可以只使用所接受模型的隐藏状态来解码序列，而无需每次对整个模型进行再训练。我正在寻找一种方法将这些隐藏的</e

浏览 0提问于2019-08-22得票数 0

1回答

Tensorflow Keras* LSTM推理一次一个输入*

python、tensorflow、keras、lstm

我有以下对Keras模型进行标记的序列： tf.keras.layers.Dropout(0.5), tf.keras.layers.Dense(2)该模型采用向量序列，并对两类的逻辑进行预测。在一个实时应用程序中，我每秒钟一次得到这些向量，我只想对接收到<e

浏览 2提问于2020-06-30得票数 1

回答已采纳

3回答

如何从keras模型中删除层，以便用作创建另一个模型的基线

python、tensorflow、keras、google-aiy

我需要在Keras(keras.applications.VGG16)中使用一个经过预先训练的模型，作为从它的第一层创建另一个模型(用于进行转移学习)的基线。在这两种情况下，它似乎都有效，当我使用new_model.summary()时，它只显示VGG16模型的期望的第一层加上为自定义而添加的新层，但是当导出模型</em

浏览 6提问于2020-08-01得票数 1

回答已采纳

1回答

两个序列到序列模型的差异-- keras* (有和没有RepeatVector)*

python、keras、sequence-to-sequence

我试图理解这个模型描述之间的区别，如下所示：from keras.models import Model=True)(decoded) encoder = Model(inputs, encoded) 这里描述的序列序列模型是第一个模型不是将解码器的

浏览 1提问于2018-07-24得票数 3

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

使用变压器时，“逻辑”和“标签”必须具有相同的形状(无，512,768)和(无，1)。

如何使用TFBertModel的隐藏状态作为自定义Keras模型的一部分？

保存包装在Keras中的模型

使用huggingface包中的XLNet转换器训练模型

有没有办法将bert-large用作文本分类工具而无需微调？

TypeError:层的输入应该是张量。Got: last_hidden_state

向Huggingface转换器添加额外的层

如何获取经过微调的TFBertModel的隐藏状态？

如何将初始隐藏状态传递给lstm层？

创建CoreML LRCN模型

如何在HuggingFace变压器库中获取预训练的BERT模型的中间层输出？

科拉斯(TF)怎么知道如何区分我的习惯损失？

tf.keras.models.save_model和优化器警告

Keras -如何获得非规范化逻辑而不是概率

TensorFlow在密集输出层的输入形状误差与model.summary()所说的不一致

我是否可以使用下一层的输出作为Keras当前层的输入？

如何保存和重新加载Keras编解码模型的隐藏状态以进行推理

Tensorflow Keras* LSTM推理一次一个输入*

如何从keras模型中删除层，以便用作创建另一个模型的基线

两个序列到序列模型的差异-- keras* (有和没有RepeatVector)*

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐