如何为可变长度序列制作掩码，然后在RNN的tensorflow2中填充这些掩码

tensorflow、padding、recurrent-neural-network、masking

尝试在LSTM网络中实现一系列时间段的掩码，并填充零。每个时间周期序列具有不同的长度，因此需要填充和掩蔽。我正在尝试对长度为96(时间段)和features=33的序列进行建模。简化的数据(7个时间段和3个特征)如下所示： time0(t0)的时间周期= 4、2、9的示例状态示例序列= [2，3，6，1，6，

浏览 19提问于2020-07-28得票数 0

1回答

Tensorflow dynamic_rnn降级

python、tensorflow、keras、recurrent-neural-network、embedding

tf.nn.dynamic_rnn似乎遭到了反对：我已经签出了keras.layers.RNN(单元格)，它说它可以使用掩蔽，我假设它可以替代dynamic_rnn的sequence_length该层支持用可变的时间步骤对输入数据进行掩蔽。若要将掩码引入数据，请使用嵌入层，将mask

浏览 2提问于2019-03-20得票数 3

回答已采纳

2回答

RNN是否应该将可变长度序列上的注意力权值重新归一化为“掩蔽”零填充效应？

tensorflow、machine-learning、deep-learning、rnn、attention-model

自我关注基本上只是计算RNN隐藏状态的加权平均值(均值池的推广，即非加权平均)。当同一批中有可变长度序列时，它们通常是零填充到批中最长序列的长度(如果使用动态RNN)。当计算每个序列的注意权值时，最后一步是一个软件最大值，因此注意权重之和为1。然而，在我所看到的每一次注意实现中，都没有注意掩盖或取消零

浏览 0提问于2018-03-27得票数 12

回答已采纳

1回答

直接训练Transformer编码层和填充序列的正确方法

deep-learning、pytorch、transformer

我已经有了嵌入序列，我将其视为我的数据集。我对如何处理填充和注意掩码感到困惑，只想确保我的理解是正确的。我的序列的长度从3到130不等。这是否意味着我应该将我的所有序列都填充到130个部分？如果是这样，我填充哪个值有关系吗？对于注意力面具，我相信我希望每个部分都关注序列中的所有其他部分。<

浏览 39提问于2021-08-16得票数 2

回答已采纳

1回答

变长序列上窗口的平均池

python、tensorflow、moving-average、pooling

我有一个形状的张量in (batch_size，功能，步骤)，并希望通过时间维度(steps)上的平均池( steps)获得相同形状的输出张量out，窗口大小为2k+1，即：对于没有k之前和后续时间步骤的时间步骤，我只想计算现有时间步骤的平均值。然而，张量中的序列具有可变的长度，并相应地填充了零，因此，我将<em

浏览 8提问于2020-03-23得票数 0

回答已采纳

1回答

在动态rnn中填充具有0个向量的批次

tensorflow、rnn

我有一个处理输入数据的可变序列的预测任务。根据这篇文章，直接使用动态rnn会遇到拆分输出的麻烦：因此，我想知道是否有可能填充整个序列批次，以使所有示例都具有相同数量的序列，然后在tf.nn.dynamic_rnn的sequence_length参数中，我为填充的序列批次指

浏览 16提问于2017-08-12得票数 0

1回答

神经网络中的超长序列

deep-learning、lstm、sequence、sequence-to-sequence

初学者关于神经网络中序列的问题:假设我有分类问题，看起来如下：类取决于整个序列--不可能在没有看到所有类的情况下确定类。NN是怎么处理这个的？我已经阅读过各种方法，例如截断序列(这是一个问题--序列的截短部分没有类，所以我不能标记它)，使用编码器/解码器lstm (同样，不能完全理解它如何解决问题)等等。

浏览 0提问于2018-05-03得票数 2

1回答

ValueError:检查输入时出错:期望the_input具有三维，但得到形状为(14174，1)的数组

lstm、rnn、speech-to-text、reshape

在对音频数据进行预处理并应用"MFCC特征化“之后，我将所有内容添加到列表中并获得(14174,)的形状。知道每个样本有不同的长度，但是有相同数量的特性，例如：print(X[12000].shape)>> (301, 13) 现在，当我用定义为checking input: expected the_input to have 3 dimensions, but got array with shape

浏览 0提问于2020-07-01得票数 0

1回答

如何解决LSTM DQN的数组输入形状错误？

input、lstm、layer、shapes、dqn

我正在构建一个带有LSTM层的DQN。尝试将96timeperiod，33个特征数组传递给模型，以进行训练，即: shape=(96，33)还试图实现后填充掩码(val=0。)以适应可变长度序列(最大length=96)。lr=LEARNING_RATE, decay=DECAY),当我提交一个名为current_states、形状为(96，33)的序列时Fu

浏览 18提问于2020-08-01得票数 0

2回答

掩蔽层与attention_mask参数在MultiHeadAttention中的关系

python、tensorflow、keras、transformer-model

我在变压器模型中使用MultiHeadAttention层(我的模型非常类似于命名实体识别模型)。因为我的数据有不同的长度，所以我在MultiHeadAttention中使用填充和attention_mask参数来屏蔽填充。如果我在使用Masking层之前使用MultiHeadAttention，它是否会产生与attention_mask参数相同的效果？

浏览 27提问于2022-09-07得票数 5

回答已采纳

1回答

Tensorflow取蒙面张量元素的平均值

python、tensorflow、mean、mask、loss-function

为了处理可变长度的输入序列，所有输入序列都被填充到相同的长度中。这对计算损失价值有影响。因此，掩码张量与损耗张量相乘，使填充元素0产生的损失。但在使用tf.math.reduce_mean或tf.keras.metrics.Mean计算损失平均值时，这些填充元素对平均损失有影响。所以我的问题是，怎样才能算出坦索弗洛的<

浏览 11提问于2019-11-23得票数 0

回答已采纳

1回答

从不同长度的数组列表中输入队列

python、input、tensorflow、queue、pipeline

我有一个不同长度的数组列表(可以是numpy数组，也可以是int列表)，我希望将其输入到一些TensorFlow队列中，以测试更大的输入管道--而不是序列化它们并从文件系统中重新读取。有可能吗？

浏览 8提问于2017-04-27得票数 0

1回答

为什么批处理不能有可变长度的序列/数据条目(例如是句子)？

tensorflow、neural-network、keras、recurrent-neural-network、backpropagation

我读过许多关于如何在批中包含可变长度序列的帖子(我理解对这些帖子的答复)，但是我找到的唯一一篇关于为什么是的文章，答案是“在一个批内，您必须有相同的时间步骤，因为它必须是一个张量(这是典型的0填充)”。在训练批次中，为什么数据条目(我举了例句的例子)不能有可变的长度(

浏览 0提问于2018-08-25得票数 1

1回答

Tensorflow数据集掩码序列用于评价

python、tensorflow、keras

问题：我有一个用tf.data.Dataset表示的数据集，其中每个示例包含3个属性： src -输入sequencetgt

浏览 0提问于2020-07-23得票数 0

1回答

快速和慢速标记器产生不同的结果

python、nlp、huggingface-transformers、bert-language-model、huggingface-tokenizers

在使用HuggingFace的pipeline tool时，我惊讶地发现在使用快速记号赋值器与慢速记号赋值器时，输出存在显著差异。具体地说，当我运行填充掩码管道时，分配给填充掩码的单词的概率对于快速和慢速记号赋予器是不同的。此外，尽管快速标记器的预测保持不变，而与输入的句子数量和长度无关，但对于慢速标记器则不是如此。为简洁起见，我省略了实际输出，但在所有示例中，分

浏览 27提问于2020-04-12得票数 3

2回答

TensorFlow中的序列标记

sequence、tensorflow、lstm

我已经成功地用tensorflow训练了一个word2vec，并且我想把这些结果输入到一个带有lstm细胞的rnn中进行序列标记。有人能为我指出如何开始这项任务的正确方向吗？

浏览 0提问于2015-12-25得票数 7

回答已采纳

1回答

不规则间隔的事件建模

machine-learning、deep-learning、feature-engineering

我得到的数据代表了一系列不定期的事件和结果。有固定数量的事件类型，其中大约10种。正在建模的结果是二进制的。可以说，将以下内容纳入该模式是重要的：( 2)事件发生的顺序用户有事件A在开始，5个月后事件C，结果是积极的。另一个用户有事件B在开始，3天后事件A，2天后事件D，结果是否。我还为每个用户提供了一些静态(非序列数据)，我想要合并

浏览 0提问于2020-02-03得票数 1

回答已采纳

2回答

如果我不想做自回归，我如何使用PyTorch Transformers完成seq2seq任务？

python、pytorch、transformer

我可能错了，但看起来PyTorch转换器是自回归的，这就是屏蔽的目的。但是，我见过一些实现，人们只使用编码器并将其直接输出到Linear层。在我的例子中，我试图将一个语谱图(行是频率，列是时间步)转换为另一个相同维度的语谱图。我正在尝试弄清楚如何做到这一点，这是一段不可能的时间。mask.float().masked_fill(mask == 0, float('-inf')).masked_fill(mask == 1, float(0.0))

浏览 0提问于2020-11-11得票数 8

1回答

Tensorflow RNNs变长序列填充零对学习的影响

python、tensorflow

我在tensorflow中设置了一个RNN，它接受一个可变的序列，并在序列的末尾进行1次预测。我已经将我的数据填充到了500序列的最大长度，但是一批中的许多序列将小于500。我使用dynamic_rnn并将批处理中每个样本的序列长

浏览 2提问于2016-12-05得票数 3

回答已采纳

2回答

Tensorflow中变长序列的双向LSTM

tensorflow、lstm、bidirectional

我想在tensorflow中训练一个双向LSTM来执行序列分类问题(情感分类)。如何使用双向LSTM来管理这个问题？"sequence_length“参数是否自动从后向序列中的</em

浏览 4提问于2017-03-21得票数 7

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

Tensorflow dynamic_rnn降级

RNN是否应该将可变长度序列上的注意力权值重新归一化为“掩蔽”零填充效应？

直接训练Transformer编码层和填充序列的正确方法

变长序列上窗口的平均池

在动态rnn中填充具有0个向量的批次

神经网络中的超长序列

ValueError:检查输入时出错:期望the_input具有三维，但得到形状为(14174，1)的数组

如何解决LSTM DQN的数组输入形状错误？

掩蔽层与attention_mask参数在MultiHeadAttention中的关系

Tensorflow取蒙面张量元素的平均值

从不同长度的数组列表中输入队列

为什么批处理不能有可变长度的序列/数据条目(例如是句子)？

Tensorflow数据集掩码序列用于评价

快速和慢速标记器产生不同的结果

TensorFlow中的序列标记

不规则间隔的事件建模

如果我不想做自回归，我如何使用PyTorch Transformers完成seq2seq任务？

Tensorflow RNNs变长序列填充零对学习的影响

Tensorflow中变长序列的双向LSTM

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐