TensorFlow强化学习softmax层

文章/答案/技术大牛

发布

2回答

python、tensorflow、neural-network、reinforcement-learning、softmax

我有一个关于TensorFlow代码的问题。我的决策是由sigmoid层给出的，后来用该层给出的概率随机选择。现在我有了三个离散的可能决策的环境，所以我尝试了softmax层，但它不起作用。当我启动TensorFlow会话时。tf.nn.elu, kernel_initializer=initializer) outputs = tf.nn.softmaxtf.multinom

浏览 27提问于2020-07-13得票数 0

回答已采纳

1回答

我试图编程一个强化学习算法使用策略梯度，灵感来自。卡帕的例子只有上下两个动作，所以一个输出神经元就足够了(高activation=UP，低activation=DOWN)。我想把它扩展到多个动作，所以我相信我需要输出层上的softmax激活函数。但是，我不确定输出层的梯度应该是多少。如果我在监督学习环境中使用具有softmax激活的交叉熵损失函数，神经元的梯度就是：其中target[i] = 1用于所需的操作，0用于所有

浏览 6提问于2017-05-10得票数 3

回答已采纳

1回答

Keras CTC损失输入

tensorflow、keras

在该示例中，CTC Lambda层的输入是softmax层(y_pred)的输出。Lambda层调用内部调用Tensorflow的ctc_loss的ctc_batch_cost，但是说ctc_loss函数在内部执行softmax，所以您不需要首先使用softmax。我认为正确的用法是将inner传递给Lambda层，所以您只在ctc_loss函数内部应用一次softmax。我已经试过这个例子了，效果很好。我应该学习这

浏览 2提问于2017-04-18得票数 10

回答已采纳

0回答

具有特定自定义成本函数的Tensorflow NN

tensorflow

我正在尝试在tensorflow中创建一个不属于回归类别分类的神经网络。它可能更接近强化学习。我已经制作了一个带有几个ReLU隐藏层的网络，它以3个元素的softmax输出层结束。然而，当处理产生矩阵而不是向量的批处理时，我不知所措(嘿)如何以TensorFlow优化器可以使用的方式将其表示为成本函数。简单地使用上面的示例代码将产生一个无意义的批量大小^2大小的矩阵。

浏览 2提问于2016-07-06得票数 1

1回答

对象定位MNIST Tensorflow :损失不会减少

tensorflow、pytorch、localization、bounding-box

我正在尝试将Tensorflow对象定位代码转换为Pytorch。但是，尽管如此，我的损失并没有减少，但它的崩溃，准瞬间与Tensorflow代码。我用torchinfo.summary检查了这个模型，它看起来和Tensorflow实现一样有效。我的训练循环和.compile .fit 和.fit Tensorflow方法一样有效吗? self.dense_classifier = nn.Linear(in_features=128, out_features=10)

浏览 2提问于2022-06-03得票数 0

1回答

为什么keras-rl示例总是在输出层选择线性激活？

keras、reinforcement-learning、openai-gym

我完全是强化学习的新手。我有一个关于keras-rl代理的输出层的激活函数的选择的问题。在keras-rl ()提供的所有示例中，在输出层选择线性激活函数。为什么会这样呢？例如，如果我使用离散操作空间为5的OpenAI环境，我是否也应该考虑在代理的输出层中使用softmax？提前谢谢你。

浏览 17提问于2017-08-04得票数 4

回答已采纳

3回答

强化学习工具

reinforcement-learning

Tensorforce、Kerasrl和chainerrl用于强化学习的区别是什么？据我所知，这三种方法都与OpenAI健身房环境有关，并且具有相同的强化学习算法。在表现上有什么不同吗？

浏览 1提问于2018-09-10得票数 1

1回答

softmax层的裁剪阈值

neural-network、deep-learning、tensorflow

最近，我遇到了一篇关于使用(相当简单的) LSTM进行情感分类的论文，它将其网络设置描述为：有人能给我解释一下吗?这样我就知道如何用Tensorflow来实现它了？非常感谢！更新，好的，我找到了他们的代码，下面是他们如何

浏览 0提问于2016-12-22得票数 3

1回答

如何用强化学习算法建立实时控制器

tensorflow、real-time

我正在尝试使用强化学习来控制一个实际的机器人操纵器。对于强化学习，我使用的是Google tensorflow。C++中有没有使用Tensorflow强化<em

浏览 0提问于2019-04-01得票数 0

2回答

Tic-Tac-Toe中的Tensorflow

tensorflow

**TLDR的底部我已经搜索了几天，而我只是不知道什么谷歌，因为我是非常新的机器学习。经过研究，我认为tensorflow是一个很好的起点(我愿意接受其他建议)。当我寻找tensorflow的例子时，它们都需要一个大型的数据存储库才能输入程序，但我更感兴趣的是创建一个在玩游戏时学习的AI，比如Tic Tac Toe。我很难搞清楚该怎么做。TLDR:有什么好的、简单的机器学习程序(最好是tensorflow)可以帮助我制作一个Tic-Tac-Toe AI。

浏览 1提问于2019-03-19得票数 0

回答已采纳

1回答

基于softmax的Keras强化训练

keras、reinforcement-learning、softmax

我正在从事的一个项目有一个使用算法的强化学习阶段。所使用的模型具有最终的softmax激活层，因此采用负学习速率作为负奖励的替代。我对这一过程有些怀疑，也找不到关于使用负学习率的大量文献。np.concatenate(st_tensor, axis=0),更新，测试结果我只测试了阳性的强化样本，省略了所有的阴性样本，从而降低了负学习</

浏览 3提问于2017-07-12得票数 1

回答已采纳

1回答

Keras - softmax函数的默认轴被设置为Axis

python、tensorflow、keras、softmax、activation-function

我正在学习如何创建顺序模型。我有个模特：然后，我继续添加池层和卷积层(这很好)。但在创建致密层时：这条线又回来了：这是带角角的虫

浏览 0提问于2018-05-13得票数 1

回答已采纳

1回答

在ReLu激活中使用Glorot初始化是错误的吗？

neural-network、deep-learning、keras、activation-function、weight-initialization

浏览 0提问于2020-01-23得票数 5

1回答

关于Google转换器教程的问题

tensorflow、google-colaboratory、transformer-model

我想在这里学习Tensorflow转换器教程： self.final_layer = tf.keras.layers.Dense(target_vocab_size)我遗漏了什么？提前感谢您的协助。

浏览 7提问于2021-12-11得票数 0

1回答

Tensorflow CNN不学习(图像中的图像输出)

python、tensorflow

我被困在一个大学项目的Tensorflow卷积神经网络上，我希望有人能帮我。网络似乎没有学到任何有用的东西，我有一种感觉，我忘记了一些基本的东西。当学习时，准确率约为5%。我基于tensorflow mnist教程编写的代码。下面是我缩短的代码，以使其更易读：from PI

浏览 2提问于2018-03-09得票数 0

回答已采纳

8回答

单词logits在TensorFlow中的含义是什么？

tensorflow、machine-learning、neural-network、deep-learning、cross-entropy

在下面的TensorFlow函数中，我们必须在最后一层提供人工神经元的激活。我能理解。但是我不明白为什么它被称为logits？这不是一个数学函数吗？loss_function = tf.nn.softmax_cross_entropy_with_logits( labels = target_output

浏览 2提问于2017-01-04得票数 343

1回答

具有SGD的多项logistic softmax回归

python、machine-learning、neural-network、logistic-regression、gradient-descent

这是我到目前为止所拥有的代码：import numpy as np returnfor i, sample in enumerate(train_x): soft = softmaxerror * rate * sample # print(error

浏览 0提问于2017-10-24得票数 0

6回答

TypeError: softmax()得到了一个意想不到的关键字参数'axis‘

python-2.7、keras、softmax

out_layer = tf.add(tf.matmul(layer_4 , weights['out']) , biases['out'])model.add(Activation('softmax')) TypeError:

浏览 5提问于2018-06-09得票数 12

回答已采纳

1回答

TensorFlow2.0中的spatial_softmax层

tensorflow、keras、deep-learning、softmax

Tensorflow 1.X曾经有一个层tensorflow.contrib.layers.spatial_softmax。该层基本上在每个通道上执行softmax，并返回最大点的坐标。

浏览 25提问于2020-03-08得票数 0

1回答

tensorflow神经网络中的误差加层

tensorflow、neural-network、tensorflow2.0

import tensorflow as tf from tensorflow.kerasactivation = 'relu') # this adds a dense hidden layer 我试

浏览 2提问于2020-09-15得票数 0

回答已采纳

点击加载更多