我的DDQN网络是否正确实施？

、、、

下面是我的重放/训练函数实现。我创建了DDQN，以便在重放/训练期间model落后于model2 1批大小。通过设置self.ddqn = False，它将成为一个普通的DQN。这是正确实现的吗？我将这篇论文作为参考： def replay(self, batch_size): self.

浏览 13提问于2020-05-12得票数 0

4回答

为什么我的深Q网和双深Q网不稳定？

、、、

我正在尝试实现DQN和DDQN(都有经验的答复)来解决OpenAI AI-GymCart极地环境.这两种方法有时都能够学习和解决这个问题，但并非总是如此。我的网络只是一个前馈网络(我尝试使用1和2个隐藏层)。在DDQN中，我在DQN中创建了一个网络，在DDQN中创建了两个网络，一个评估Q值的目标网络和一个选择最佳动作的<

浏览 0提问于2018-10-12得票数 4

2回答

DDQN和DQN有什么区别？

、、、

我想我不明白DQN和DDQN在实现上有什么区别。我知道在DDQN运行期间我们改变了traget网络，但我不明白在这段代码中是如何实现的。我们将self.target_model.set_weights(self.model.get_weights())放在DDQN的实现中，这是在DQN的操作完成后添加的，https://github.com/keon/deep-q-learni

浏览 0提问于2018-09-22得票数 10

2回答

如何在RL中获取q值

、、、

我不知道如何获得DDQN的Q值。 tar_next = self.TAR.predict(n_states) # TAR batch predict Q on next_statesq_values[i][actions[i]] = (rewards[i] + (GAMMA * tar_next[i][act])) 哪

浏览 6提问于2019-12-22得票数 1

回答已采纳

1回答

双DQN的表现明显差于香草DQN

、、、、

我有一个代理必须探索一个定制的环境。我用tau=1e-3在代码中使用目标网络的软更新。我的问题是，双DQN的表现似乎比香草DQN差得多，我不知道为什么。应该表现得更好对吧？奖励函数有什么问题吗？还是我做错了什么？

浏览 7提问于2022-07-27得票数 0

1回答

我对工厂方法的实施是否正确？

、、

我正在研究工厂的方法模式，并在一些地方的读者之后，我做了以下的实现。如果将来需要添加新类型的板，那么每次我必须更改BoardFactory类和枚举时？这是实现工厂方法的正确方法吗？

浏览 0提问于2013-09-07得票数 0

回答已采纳

1回答

我是否以正确的方式实施了坚实的原则？

这是我第一次使用坚实的原则编写C++代码。因此，我不知道下面的示例代码是否正确地实现了这些原则。我的问题遵循规则。{ pOwner->Execute();问题：它是一个有效的、可靠的实现吗？我想要一个额外的

浏览 4提问于2017-03-31得票数 0

1回答

GPUDirect如何在共享设备上实施隔离

、、、、

我在这里读到了关于GPUDirect的，在那里的例子中有一个网卡连接到PCIe以及两个图形处理器和一个中央处理器。网络设备是否使用某种SR-IOV机制来实施隔离？

浏览 2提问于2013-12-26得票数 2

1回答

有没有办法检查中继是否注入了graphql服务器？

、、

Relay.injectNetworkLayer(新Relay.DefaultNetworkLayer(${GRAPHQL_SERVER}/graphql) )；那么我怎么知道graphql服务器已经成功注入了这个远程

浏览 0提问于2016-11-28得票数 1

1回答

应用程序中的购买不适用于3G设备

、、

我开发了一个iPhone应用程序，它实现了应用程序中的购买(服务器模型)。在测试过程中，我遇到了一个非常奇怪的问题。我已经在Wi网络上测试过了。应用程序运行良好。所有下载(使用沙箱帐户)，一切都是成功的测试。然而，当我尝试使用3G连接下载相同的产品时，会提示错误消息(来自App )，上面写着"Wifi必需的。这个项目只能通过wifi连接下载“。我在网上没有发现任何与这个问题有关的东西。<

浏览 2提问于2011-08-26得票数 2

2回答

Kubernetes calico网络策略

、、

我是Kubernetes的新手，正在尝试学习calico网络。我遵循此文档()，并尝试为在后端到客户端之间流动的流量创建网络策略：apiVersion: networking.k8s.io/v1 namespacematchLabels: ports: port: 9000 <e

浏览 1提问于2018-10-02得票数 0

1回答

Netlogo中的一步累积死亡率模型程序

请告知我在以下每一步死亡率的网络标识程序中可能做错了什么(我正在实施“传递”程序，作为“开始”过程中的一步)： ask turtles [ if chances >= 1 [die] ]以上代码正确吗即使它是正确的，是

浏览 3提问于2017-05-23得票数 0

回答已采纳

6回答

云安全解决方案的优势是什么？

、、

当企业希望将其全部或部分业务迁移到云中时，存在不可避免的安全问题。我们的网站在云端是否安全？在云中托管我们的应用程序数据是否会使我们的业务更容易受到网络攻击？我们的云服务器可以处理DDoS攻击吗？什么是云安全以及为我们的业务实施它的正确方法是什么？正确完成云安全是解决所有这些问题的解决方案，使其成为创建适用于全球企业（和客户）的</em

浏览 9488提问于2018-09-19

1回答

用Keras和TensorFlow实现LSTM网络

、、、、

由于知识有限，我建立了一个LSTM网络。我想验证我的假设并更好地理解Keras。网络代码：model.add(LSTM(8, batch_input_shape=(None, 100, 4), return_sequences=True)) 我想要

浏览 0提问于2018-10-04得票数 0

回答已采纳

1回答

电极.层数和神经元数.模型参数

、、

有谁能建议我如何在DDQN算法中求出最优的图层数、神经元数、深度学习模型参数。当输入和输出神经元分别为4和2时，在选择隐层数和隐层数时，是否有科学原因或数学依据。我按照这个链接建立了强化学习算法https://pylessons.com/CartPole-reinforcement-learning/。

浏览 0提问于2021-06-21得票数 1

2回答

如何测试网络监控？

、、、

我目前正在构建一个网络监控系统，如果有任何接口错误或网络问题，它会通知我。在构建它之后，我们希望能够在将其实施到我们的网络之前测试它是否正常工作，因此需要一种在交换机或网络设备上模拟网络接口错误的方法？肖恩

浏览 4提问于2013-03-26得票数 0

1回答

如何分配块链(网络)

、

我不知道这是否是问这个问题的正确论坛，但为了学习目的，我正在实施自己的区块链。我现在有一个简单的PoW区块链。假设我已经决定使用其中一个节

浏览 0提问于2022-12-27得票数 1

1回答

异步和同步网络上的客户端调用

、

我想知道客户端应该如何在服务器网络上发送请求。在上述4种实现中，哪一种是最好的实现。

浏览 0提问于2013-10-22得票数 0

3回答

具有多个QueueManager的应用程序

、、

我需要将消息发送到不同的队列管理器(不同的QM名称、主机端口对)。处理这种情况的最佳方法是什么？我需要为每个队列管理器创建单独的ConnectionFactory吗？用例:向分布式代理(FTE代理)发送命令消息的Java服务。但是，这些代理可以监听不同队列管理器上的不同队列。

浏览 1提问于2015-09-02得票数 1

2回答

android -后台服务

、、、、

我正在编写android应用程序，这将从服务器请求数据后，每5分钟，并将加载到sqlite。稍后，每当用户想要查看数据时，就会向用户显示来自sqlite的数据。数据库将只包含最多2天的数据，并将继续删除较旧的数据。提前谢谢。

浏览 2提问于2018-01-23得票数 1

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

为什么我的深Q网和双深Q网不稳定？

DDQN和DQN有什么区别？

如何在RL中获取q值

双DQN的表现明显差于香草DQN

我对工厂方法的实施是否正确？

我是否以正确的方式实施了坚实的原则？

GPUDirect如何在共享设备上实施隔离

有没有办法检查中继是否注入了graphql服务器？

应用程序中的购买不适用于3G设备

Kubernetes calico网络策略

Netlogo中的一步累积死亡率模型程序

云安全解决方案的优势是什么？

用Keras和TensorFlow实现LSTM网络

电极.层数和神经元数.模型参数

如何测试网络监控？

如何分配块链(网络)

异步和同步网络上的客户端调用

具有多个QueueManager的应用程序

android -后台服务

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐