在tensorflow 2.0中计算句子填充嵌入查找的原始序列长度

python、tensorflow、tensorflow2.0

text_tensor是形状[None,sequence_max_length,embedding_dim]中的张量，它包含一批序列的嵌入查找。使用零来填充序列。我需要在shape [None] (None是批处理大小)中获得一个名为text_lengths的列表，该列表包含没有填充的每个序列的长度。我试过几个脚本。我得到的最接近的</e

浏览 20提问于2021-05-11得票数 1

回答已采纳

1回答

在运行时将特征连接到输入层的单词嵌入

python、tensorflow、deep-learning、theano、feature-extraction

假设我在嵌入查找后获得一个输入矩阵，如下所示： [ [0.5, 0.25, 0.47, 0.86，0.8. 0.12, 0.63, 0.97，0.7, 0.47, 0.32, 0.01]，...，[..，e在上述情况下，每个嵌入的dim =4，句子长度为3。我们如何使用Tensorflow/TFLearn或Theano中的占位符动态地(即，在运行时)与句子中的每个单词相对应地附加dim s

浏览 8提问于2016-07-26得票数 2

回答已采纳

1回答

计算每个时间步的可变长度输出的成本

python、tensorflow、machine-learning、neural-network、recurrent-neural-network

我正在用时间为主的格式time_steps，batch_size，input_size来训练网络上的句子，我希望每个时间步都能预测序列中的下一个单词。序列被填充空值直到时间步长，并且单独的占位符包含批次中每个序列的长度。关于时间反向传播的概念有很多信息，但是我找不到任何关于tensorflow中用于可变长度序列成本计算

浏览 19提问于2017-12-31得票数 1

回答已采纳

1回答

Tensorflow -保持稀疏的稀疏嵌入查找

python、tensorflow、conv-neural-network、text-classification

我正在用CNN实现一个文本分类器，类似于使用Tensorflow的。Tensorflow提供了tf.nn.embedding_lookup_sparse，它允许您以稀疏张量的形式提供单词ID。这是很好的，特别是对于启用可变长度序列。但是，该函数在查找后需要一个“组合”步骤，例如“平均”或“和”。这迫使它回到致密张量空间。我不想做任何组合。我想把我的向量保持在稀疏表示中，这样以后我就可以做其他

浏览 2提问于2018-11-07得票数 2

1回答

变压器模型中位置编码的实现细节？

encoding、deep-learning、nlp、transformer-model、attention-model

这个位置编码是如何计算的？4，嵌入维数为4。，每个字嵌入，然后传递给编码器，如下图所示，就论文而言，他们给出了计算每个词的位置编码的公式，所以，我想这就是我能实现的方法，3

浏览 1提问于2020-05-01得票数 4

回答已采纳

1回答

用可训练字嵌入层和动态RNN: AdamOptimizer期望的float_ref代替浮点

python、tensorflow、nlp、lstm

我在单词嵌入序列上使用RNN对句子进行分类。一开始，我在给预先训练过的单词嵌入内容，一切都很好。我将嵌入矩阵设置为一个具有维度(词汇量、嵌入大小)的tf.placeholder，并从GloVe中提供了一些经过预先训练的嵌入。我还使用tf.nn.embedding_lookup将输入(即单词ID序列)转换为嵌入序列。然后我想让模型也训练嵌

浏览 1提问于2017-04-30得票数 1

回答已采纳

2回答

如何拟合不同长度的特征向量的scikit模型

scikit-learn、scipy、audio-processing、librosa、sound-recognition

我正在做一个声音分类项目，假设我尝试确定某个录音属于哪一类的音频记录。您可能会将其与音乐类型或主题识别(文本体)问题进行比较，我的示例长度不同，我需要为每个示例精确地分配一个标签。我将我的特性表示为2d矩阵，其中每一列代表音频文件中的一个帧(例如。每一行都是一个仅与该时间框架相关的特性(例如。MFCC系数)。现在，虽然我的行计数是固定的，列的数量将根据记录的长度而变化。我将训练和测试数据作为nump

浏览 7提问于2020-07-14得票数 0

1回答

张量中的变长维

tensorflow

句子的数量是可变的，每个句子和问题中的单词数量也是可变的。每个单词都被编码为一个整数。所以我的输入应该是批量大小，句子#，句子中的单词#的形式。我是否仍然可以以某种方式将输入表示为单个张量，或者我必须使用张量列表，这样我就有了一个长度为batch_size的列表，然后是一个句子长度数量的子列表，然后每个

浏览 1提问于2016-04-08得票数 3

1回答

词嵌入解释

python、tensorflow

在我提出这个问题之前，让我先说明这个问题已经在许多文章中得到了回答，但我仍然很难理解word嵌入的基本格式。让我们从“我喜欢狗”这句话开始。据我所知，这个向量被馈送到一个嵌入层，该嵌入层在RNN的输入张量上添加了一个额外的嵌入维度(不必是普通的RNN)。对于批中的单个条目，嵌入张量(假设嵌入维度为2)如下所示： [4.55，6.78，->

浏览 14提问于2018-12-21得票数 2

回答已采纳

2回答

基于卷积神经网络的文档分类

neural-network、classification、text-mining、convolutional-neural-network、word2vec

CNN的短文/句子已在许多论文中进行了研究。然而，似乎没有报纸使用CNN的长篇文本或文件。我的问题是，文档中有太多的特性。在我的数据集中，每个文档都有超过1000个标记/单词。对于每个矩阵，高度是文档的长度，宽度是字嵌入向量的大小。我的数据集有9000多个例子，它需要花费大量的时间来训练网络(整整一周)，这使得很难对参数进行微调。另一种特征

浏览 0提问于2016-04-11得票数 12

1回答

在tensorflow上使用word2vec作为输入的LSTM可变句子长度

python、tensorflow、lstm、word2vec

我正在构建一个使用word2vec作为输入的LSTM模型。我正在使用tensorflow框架。我已经完成了单词嵌入部分，但我被LSTM部分卡住了。这里的问题是，我有不同的句子长度，这意味着我要么做填充，要么使用dynamic_rnn指定的序列长度。我和他们两个都很纠结。垫子。填充物最让人困惑的地方是我做填充物的时候。我担心

浏览 1提问于2018-09-27得票数 3

回答已采纳

1回答

如何在Keras中设置LSTM的输入

keras、lstm、reinforcement-learning

我对Keras很陌生，我发现很难理解LSTM layer.The Keras文档中输入数据的形状，因为输入数据应该是带有形状的3D张量(nb_samples、timesteps、input_dim)。timesteps变量是否表示网络记住的时间步骤的数量？在我的数据中，几个时间步骤会影响网络的输出，但我不知道提前了多少次，也就是说，我不能说前10个样本会影响输出。例如，输入可以是构成句子的单词。每个句子中的

浏览 2提问于2017-10-07得票数 0

2回答

深度学习图书馆中NLP的动态批处理和填充批

nlp、pytorch、huggingface、dynamic-batching、pad-truncate

这是我们训练NLP的现代深度学习模型的常用方法，例如，在Huggingface库中，输入no有一个固定的长度。指记号/音音单位。https://huggingface.co/docs/transformers/pad_截断在下面的例子中，我们有5个不同长度的句子，它们都被填充到最大长度设置为1024。我问题的第一部分是关于GPU内存<em

浏览 0提问于2023-04-07得票数 2

1回答

BERT嵌入层

nlp、bert

我试图弄清楚嵌入层是如何为预先训练的伯特基模型工作的。Indices的最大长度为512。第一个word_embeddings权重将把Indices中的每个数字转换为一个768维数(嵌入维数)中的向量。现在，position_embeddings权重用于编码输入句子中每个单词的位置。从BERT模型的替代实施来看，位置嵌入是一个静态转换。这似乎也是在变压器模型中进行

浏览 0提问于2021-05-03得票数 3

回答已采纳

1回答

深度学习:如何构建字符级嵌入？

python、tensorflow、keras、pytorch、embedding

我试图在我的模型中使用字符级嵌入，但我对字符级嵌入几乎没有怀疑。，那么我们填充句子所以形状是这样的： [ batch_size , max_sentence_length , embedding_dim ] 现在，对于字符级嵌入，我几乎没有什么疑问：因此，对于字符级嵌入：这里是我的困惑所在，所以在单词嵌入中，我们首先对句子进行标记，然后使用词汇id ( wo

浏览 23提问于2019-05-14得票数 3

回答已采纳

3回答

tensorflow中的静态计算图和Pytorch中的动态计算图有什么区别？

tensorflow、deep-learning、torch

当我学习tensorflow时，tensorflow的一个基本概念是计算图，而这些图被认为是静态的。我在Pytorch中发现，这些图表据说是动态的。tensorflow中的静态计算图和Pytorch中的动态计算图有什么区别？

浏览 1提问于2017-09-11得票数 30

回答已采纳

1回答

RNN语言模型(TensorFlow)的输入是什么？

python、tensorflow、sequence、recurrent-neural-network、language-model

我想在TensorFlow中建立一个递归神经网络，它可以预测单词序列中的下一个单词。我看过几个教程，例如的教程。我知道训练文本中的每个单词都映射到一个整数索引中。但是，关于输入还有一些我没有得到的东西：对网络进行批量培训，例如同时使用128个实例。假设我们的词汇表中有10.000个单词。第二维度有多大，即序列长度？我是否在批次的每一行中使用一个句子，用零填充

浏览 3提问于2017-09-20得票数 1

1回答

bidirectional_dynamic_rnn中的跳过值

python、tensorflow、lstm、recurrent-neural-network

我希望在整个文档上使用BERT-嵌入来实现NER。一个文档由几个句子组成，每个句子都由标记组成，并有可变的长度。现在，我用BERT为每个句子创建单词嵌入，并为每个句子创建pad。然后，我想在文档的所有标记上使用双向LSTM来执行NER，而不仅仅是在句子上。如果我这样做没有微调伯特(提取特性，如与ElMo嵌入)，那么我可以只是删除填充令牌和连接所有

浏览 0提问于2019-03-31得票数 0

2回答

我能创建一个具有多个rnn单元的图层吗？[关于论文的问题]

deep-learning、time-series、lstm、rnn

结构：如其所述：特别地，我们将从每个循环编码器中学习到的嵌入向量集成到一个新的结论嵌入向量中，共同考虑具有不同⟨α，β⟩配置的各种时间序列模式。据我所知，它使用多个独立的rnn单元来处理不同的时间序列，然后将所有的隐藏状态连接在一起，形成一个3D输入，该输入可以使用2d conv提取特征。但我没有看到有办法在同一层创建多个rnn细胞，我是否误解了？？如果没有，你能给我一个指南或例子吗？

浏览 0提问于2020-11-20得票数 1

回答已采纳

1回答

如何提取和使用伯特编码的句子之间的文本相似性。(PyTorch/Tensorflow)

tensorflow、deep-learning、nlp、pytorch、bert-language-model

我想要建立一个文本相似模型，我倾向于使用该模型来查找常见问题和其他方法，以获得最相关的文本。我想对这个NLP任务使用高度优化的BERT模型，.I倾向于使用所有句子的编码来获得一个使用cosine_similarity并返回结果的相似矩阵。在假设条件下，如果我有两个句子作为hello world和hello hello world，那么我假设BRT会给出类似于[0.2,0.3,0] (0表示填充)和[0.2,0.2,0.3]的<

浏览 2提问于2020-07-22得票数 1

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

在运行时将特征连接到输入层的单词嵌入

计算每个时间步的可变长度输出的成本

Tensorflow -保持稀疏的稀疏嵌入查找

变压器模型中位置编码的实现细节？

用可训练字嵌入层和动态RNN: AdamOptimizer期望的float_ref代替浮点

如何拟合不同长度的特征向量的scikit模型

张量中的变长维

词嵌入解释

基于卷积神经网络的文档分类

在tensorflow上使用word2vec作为输入的LSTM可变句子长度

如何在Keras中设置LSTM的输入

深度学习图书馆中NLP的动态批处理和填充批

BERT嵌入层

深度学习:如何构建字符级嵌入？

tensorflow中的静态计算图和Pytorch中的动态计算图有什么区别？

RNN语言模型(TensorFlow)的输入是什么？

bidirectional_dynamic_rnn中的跳过值

我能创建一个具有多个rnn单元的图层吗？[关于论文的问题]

如何提取和使用伯特编码的句子之间的文本相似性。(PyTorch/Tensorflow)

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐