为什么trainable_variables在训练后没有变化？

trainable_variables是TensorFlow中的一个函数，用于获取可训练变量的列表。可训练变量是指在训练过程中会被优化器更新的变量，通常是神经网络模型中的权重和偏置。

如果在训练后发现trainable_variables没有变化，可能有以下几个原因：

没有定义可训练的变量：在模型的定义中，可能没有明确指定哪些变量是可训练的。在定义变量时，需要将trainable参数设置为True，才能使其成为可训练变量。例如：

weights = tf.Variable(initial_value=tf.random_normal(shape=(10, 10)), trainable=True)

没有进行反向传播：trainable_variables是根据梯度信息来确定的，如果没有进行反向传播，优化器无法更新可训练变量的值。在训练过程中，需要确保在每个训练步骤中都执行了反向传播操作。例如：

with tf.GradientTape() as tape:
    # 计算损失函数
    loss = ...
    
# 计算梯度
gradients = tape.gradient(loss, trainable_variables)

# 使用优化器更新可训练变量
optimizer.apply_gradients(zip(gradients, trainable_variables))

学习率设置过小：如果学习率设置过小，优化器在更新可训练变量时的变化可能不明显。可以尝试增大学习率，或者使用学习率衰减策略来逐渐减小学习率。
模型已经收敛：如果模型已经收敛到一个局部最优解，可训练变量的变化可能会很小。可以尝试增加训练迭代次数，或者调整模型结构、损失函数等来改善模型的性能。

总结起来，trainable_variables在训练后没有变化可能是由于未定义可训练变量、未进行反向传播、学习率设置过小或者模型已经收敛等原因导致的。在解决问题时，需要仔细检查代码逻辑，并根据具体情况进行调整。

为什么trainable_variables在训练后没有变化？

、

: print ('Epoch {} finished'.format(epoch)) 我对它进行了训练，并在之前和之后通过以下方法保存了trainable_variables t0=mnist_model.trainable_variables t1=mnist_model.trainable_variables如果是这样的话，我如何正确地观察这些更新后的变量？

浏览 23提问于2019-12-24得票数 0

1回答

tensorflow basic lstm_cell中的trainable_weights和trainable_variables有什么区别？

、

在尝试使用基本的LSTM Cell复制Tensorflow中的LSTM Cell的权重时，我偶然发现了trainable_weights和trainable_variables属性。遗憾的是，对于像我这样的菜鸟来说，并没有真正提供丰富的信息。

浏览 42提问于2018-02-28得票数 7

回答已采纳

3回答

Tensorflow对象检测掩码rcnn使用太多内存

我尝试使用掩码rcnn运行TF对象检测，但它在一个具有500 of内存的节点上一直处于死机状态。session_config = tf.ConfigProto(allow_soft_placement=True, inter_op_parallelism_threads=1,

浏览 0提问于2018-03-03得票数 4

1回答

tf.GraphKeys.GLOBAL_VARIABLES和tf.GraphKeys.TRAINABLE_VARIABLES在tensorflow中有什么区别？

、

通常，所有TRAINABLE_VARIABLES变量都在MODEL_VARIABLES中，所有MODEL_VARIABLES变量都在GLOBAL_VARIABLES中。TRAINABLE_VARIABLES:由优化器训练的变量对象的子集。有关更多详细信息，请参阅tf.compat.v1.trainable_variables。因此，据我所知，TRAINABLE_VARIABLES是GLOBAL_VARIABLES的子集，那么GLOBAL_VARIABLES还包含什么？) dtype=float32_ref>, <

浏览 3提问于2019-09-25得票数 0

1回答

评估步骤的权重衰减-- Tensorflow

、、、

现在我在想，在评估阶段，这是否仍然是正确的，或者我必须将正则化因子设置为0。还有另一个论点，trainable。

浏览 0提问于2019-02-04得票数 0

回答已采纳

1回答

有没有办法在tensorflow中强制添加新的变量到现有的检查点？

、、

假设有一个深度学习模型和一个具有预先训练好的权重的检查点。我想要做的是对预先训练的模型进行微调。然而，我发现我必须使用现有模型图中没有定义的新的ADAM优化器对模型进行微调。因为ADAM优化器本身有一些trainable_variables，所以如果我想要基于检查点对模型进行微调，我必须将它们添加到现有的检查点。有没有办法在tensorflow中强制添加新的变量到现有的检查点？

浏览 19提问于2020-01-15得票数 0

1回答

为什么我不能对作为参数传递给tf.function的变量执行渐变？

、、、、

我的训练循环给了我以下警告： import numpy as npimport tensorflow_proba

浏览 11提问于2021-07-09得票数 0

4回答

是否有可能使一个可训练的变量不能被训练？

、

我在作用域中创建了一个可训练的变量。后来，我输入了相同的作用域，将作用域设置为reuse_variables，并使用get_variable检索相同的变量。我的get_variable线路是这样的：但是变量'weights'仍然在tf.trainable_variables可以使用trainable将共享变量的False标志设置为get_variable 我想这么做的原因是，我试图<

浏览 5提问于2016-05-19得票数 38

回答已采纳

1回答

自定义Keras损失，以最小化超过给定阈值的元素数

、、、、

fail_count = tf.cast(tf.size(vector[vector>5]), tf.float32) 但是，我遇到以下错误： ValueError:没有为任何变量提供梯度

浏览 4提问于2022-08-10得票数 0

回答已采纳

2回答

在哪些情况下，我们在TF2中使用属性trainable_variables而不是trainable_weights，反之亦然？

、、

我正在研究如何在TF 2中进行迁移学习，我看到在中，他们使用属性trainable_variables来引用模型的可训练变量，但在这个中，他们使用tf.keras.Model的属性trainable_weights/kernel:0batch_normalization/gamma:0我检查了这个，并尝试遵循这两个属性的定义：trainable_variables所以，我想知道在哪些情况下我们使用<

浏览 2提问于2020-06-07得票数 3

2回答

如何理解tf.get_collection()在TensorFlow中的应用

我对tf.get_collection()表单感到困惑，它说 from_vars = tf.get_collection(tf.GraphKeys.TRAINABLE_VARIABLES, from_scope)但是，如果我想从另一个作用域获取变量，如何使用这个函数？谢谢!

浏览 3提问于2017-06-22得票数 16

回答已采纳

1回答

在tensorflow中更改模型-联合但不工作

我尝试在联合学习图像分类教程中更改模型(只是层和隐藏层)。但结果表明，w1和b1在多次迭代后没有变化，并保持初始值0。只有w2和b2可以在培训中接受培训。下面是我的代码：我还在可训练变量中添加了w2和b2。但他们似乎没有在训练过程中接受过训练，我不知道为什么。有没有人在本教程中有一些成功的经验来改

浏览 19提问于2019-08-21得票数 0

3回答

如何解决在将py手电变量转换为numpy时更改的值？

、、、、

我正在尝试将resnet34的一个参数转换为numpy，但我发现转换后值会发生变化，如图所示。为什么会发生这种事？如何才能获得numpy格式的精确值？(我正在尝试获取torch预训练模型中的参数，并将它们放到tensorflow 1.x模型中，因为我在tensorflow1搜索中找不到一个经过预训练的tensorflow1模型。恐怕这种数值的变化会影响模型的准确性。) (顺便说一句，有什么方法可以下载tensorflow1.x 1.x resnet34预训练</

浏览 7提问于2020-06-10得票数 1

回答已采纳

1回答

使用tfhub模块冻结BERT层

、、

在这个链接中，作者说：module = hub.Module(<<Module URL as string>>, trainable=True)

浏览 15提问于2020-05-15得票数 0

回答已采纳

1回答

为什么这些梯度累积实现不能工作？

注意： final_gradients = [grad * apply for grad in gradients] self.g in self.accu_grad

浏览 8提问于2021-06-24得票数 1

回答已采纳

1回答

在tensorflow中，tf.Session()以外的参数值可用吗？

、、

我是tensorflow的新手，我正在学习本教程，它正在做变差的训练，以训练NN 。range(n_post):我的问题是： (1)利用tf.Session对神经网络进行训练和评价但是，如果在sess之外(例如，从# Sample开始，从后面开始)，由优化器训练的参数值仍然可用吗？(它们是全局变量还是sess中的局部变量)。或者它仍然可用，因为它使用的是相同的sess？(为什么这里使用的是Ad

浏览 0提问于2018-03-23得票数 3

回答已采纳

2回答

TensorFlow:向LSTM添加正则化

、、

在之后，在训练LSTM单元参数时，我尝试在成本函数中增加正则化项。抛开我的一些常量： cost = 0我遇到的问题是，添加正则化术语会极大地减缓学习过程，而当与pred - y相关的术语几乎停滞时，正则化项pred - y随着每次迭代而明显增加，也就是说，reg_cost似乎没有被

浏览 5提问于2017-01-24得票数 4

回答已采纳

1回答

( Tensorflow)为什么恢复后没有分配变量？

、、、

我正在学习tensorflow，并用预先训练过的alexnet重量做一个实验。但在恢复后，权值不随初始化时使用的值而变化。为什么会发生这种事？所有代码(偶数，tensorflow官方站点)只是引入了用于还原的代码：但这段代码对变量没有任何影响。结果如下：正如您所看到的，

浏览 1提问于2017-05-27得票数 1

回答已采纳

1回答

如何使用Tensorflows ()计算偏差

、

我希望在自定义NN架构上实现GradientTape()，但我没有看到任何关于如何使用它来计算偏差的解释。here也回答了类似的问题，但没有得到完全回答。举个简单的例子，我的神经网络的训练步骤如下： self.W = ## Initialized earlier on @tf.function那么，如何在代码中将偏差项作为可训练变量来实现呢？我不打算用trainable_variables来实现这一点，所以不要建议我

浏览 22提问于2020-01-01得票数 0

1回答

将短tensorflow 1.13脚本转换为tensorflow 2.0

、、

我认为我挣扎的主要原因是因为张力流2.0的例子，我见过训练神经网络，所以他们有一个model，他们compile和fit。但是，在下面的简单示例中，我没有使用神经网络，因此我无法理解如何将此代码改编为tensorflow2.0 2.0(例如，如何替换会话)。帮助是非常感谢和感谢提前。10): optimizer.apply_gradients(loss) 但是，上面的内容显然没有运行:S 有没有人？注意，我没有

浏览 0提问于2019-05-09得票数 0

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

为什么trainable_variables在训练后没有变化？

相关·内容

为什么trainable_variables在训练后没有变化？

tensorflow basic lstm_cell中的trainable_weights和trainable_variables有什么区别？

Tensorflow对象检测掩码rcnn使用太多内存

tf.GraphKeys.GLOBAL_VARIABLES和tf.GraphKeys.TRAINABLE_VARIABLES在tensorflow中有什么区别？

评估步骤的权重衰减-- Tensorflow

有没有办法在tensorflow中强制添加新的变量到现有的检查点？

为什么我不能对作为参数传递给tf.function的变量执行渐变？

是否有可能使一个可训练的变量不能被训练？

自定义Keras损失，以最小化超过给定阈值的元素数

在哪些情况下，我们在TF2中使用属性trainable_variables而不是trainable_weights，反之亦然？

如何理解tf.get_collection()在TensorFlow中的应用

在tensorflow中更改模型-联合但不工作

如何解决在将py手电变量转换为numpy时更改的值？

使用tfhub模块冻结BERT层

为什么这些梯度累积实现不能工作？

在tensorflow中，tf.Session()以外的参数值可用吗？

TensorFlow:向LSTM添加正则化

( Tensorflow)为什么恢复后没有分配变量？

如何使用Tensorflows ()计算偏差

将短tensorflow 1.13脚本转换为tensorflow 2.0

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐