腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
如何
提高
我
的
DQN
的
性能
?
、
、
我
创建了一个深度Q网络来玩蛇游戏。代码运行得很好,只是在训练周期中
性能
并没有真正
提高
。最后,它与采取随机动作
的
代理几乎没有区别。q value can be > 1作为参考,网络输出5个值,因为蛇可以移动
的
4个方向,以及一个额外
的
不采取行动
的
值。此外,
我
不像传统
的
<e
浏览 6
提问于2019-08-14
得票数 2
1
回答
DoubleDQN与
DQN
的
性能
比较
、
我
在健身房NChain游戏上尝试了DoubleDQN和
DQN
算法,发现DoubleDQN
的
性能
并不比
DQN
更稳定或更好。
我
将每次操作后训练
的
批量大小设置为1,
我
可以知道这是DoubleDQN没有优于
DQN
的
原因吗?
浏览 5
提问于2019-07-05
得票数 0
1
回答
如何
改进
性能
机器学习-- DQ学习模型
、
、
、
、
DQlearning上
的
月球着陆器
性能
不佳,因此
我
试图通过优化参数来
提高
月球着陆器(dq学习)
的
性能
。
我
可以调整哪一部分?有人能为
我
提供一些想法吗?添加更多层或更改激活类型或其他方法??from keras.layers import Dense, Activation, Flatten from rl.agents.
dqn
memory = SequentialMe
浏览 0
提问于2018-04-26
得票数 1
回答已采纳
1
回答
强化学习,为什么
性能
崩溃?
、
我
试图在平台上使用A3C算法和TensorFlow在TITAN X GPU服务器上训练deadly_corridor场景中
的
代理,然而,在关于2+ days
的
训练之后,
性能
崩溃了。正如您在下图中所看到
的
。走廊里有6个恶魔,特工必须杀死至少5个恶魔才能到达目的地并得到背心。这是newtwork
的
代码 self.inputs = tf.placeholder(shape=[None, *shape, 1]pol
浏览 1
提问于2017-08-07
得票数 2
回答已采纳
1
回答
将有监督
的
神经网络转化为强化学习?
、
我
有一个功能性
的
LSTM模型,它具有可接受
的
性能
。现在
我
如何
将这个受监督
的
模型转换为一个强化学习模型,以
提高
性能
?关于
如何
将有监督
的
模型转换为强化学习模型,有什么例子吗?详细信息:
我
有一个多输入多输出系统(因为
我
不能分享实际问题,让我们假设天气预报为例),
我
需要实时预测输出(如温度、风速等)。
我
有一个很大
的
数据
浏览 0
提问于2019-10-21
得票数 2
2
回答
导入任意数量
的
python文件
、
我
有不同
的
包含神经网络
的
python文件。每个python文件都有关联
的
weights.h5文件。现在
我
想创建一个python评估文件,它加载所有网络/ python文件及其权重,创建每个文件
的
一个实例并比较它们
的
性能
。 到目前为止,
我
尝试导入为包,但之后
我
无法通过索引访问模块。
我
如何
导入所有的模型并将它们
的
一个实例放在一个列表中,这样
我</em
浏览 27
提问于2018-12-19
得票数 3
回答已采纳
1
回答
与vanilla
DQN
相比,双
DQN
的
性能
较差
、
、
我
现在正在尝试优化
我
的
机器人
的
导航。
我
首先使用了一个普通
的
DQN
,在那里
我
优化了参数。模拟机器人在5000集后达到了8000个目标,并表现出令人满意
的
学习
性能
。现在,由于
DQN
在强化学习中“不是最好
的
”,
我
添加了DoubleDQN。不幸
的
是,这一个在同样
的
条件下表现得非常糟糕。
我
的
第一个问题是
浏览 24
提问于2019-11-01
得票数 0
1
回答
为什么Deep网络算法只执行一个梯度下降步骤?
、
为什么
dqn
算法只执行一个梯度下降步骤,即只执行一个时期
的
训练?它会不会受益于更多
的
时代,它
的
准确性会不会随着时间
的
增加而
提高
呢?
浏览 4
提问于2019-12-16
得票数 1
回答已采纳
1
回答
深度Q-学习Agent
性能
在一定时期后会下降。
、
我
有一个
DQN
代理,它在一个特定
的
网络上被训练来执行一个任务。然而,在训练代理时,
我
注意到,在初始
的
几个时期之后,当代理
的
得分显示出总体增长后,代理
的
性能
突然出现了急剧下降,就好像它正在重新开始一样。i代理显示
性能
从差到好
的
波动,对于
DQN
代理来说是正常
的
。
我
应该做什么诊断才能消除这种波动?
我
曾为代理商使用过经验回放和探索-开发。
我</e
浏览 0
提问于2019-01-13
得票数 0
回答已采纳
1
回答
使用cnn Q-近似构建深度强化学习
、
、
、
我
是DRL
的
新手。从这段代码https://github.com/jaromiru/cwcf开始,
我
想用CNN替换用于Q函数近似的MLP,但我不知道该怎么做。有人能帮我吗?谢谢
浏览 19
提问于2020-04-01
得票数 1
回答已采纳
2
回答
如何
提高
我
的
查询
性能
?
、
、
、
有什么方法来改善HQL
的
表现吗?
我
有这样
的
疑问:tmp_a as (CREATE INDEX insert_tim
浏览 1
提问于2019-10-16
得票数 2
回答已采纳
1
回答
如何
提高
我
的
拖放
性能
?
、
、
不知道为什么
我
的
CSS没有更新:( 更新:是否有办法使用requestAnimationFrame实现这一目标?
我
有一个旋转
的
图像卷轴,
我
希望能够左右滑动并切换到下一个或先前
的
图像(旋转集合中
的
所有图像)。
我
使用touchmove事件和css transform: translate属性来移动图像,因此用户触摸时,向左和右滑动是响应
的
。也就是说,在touchstart和touchend触发之间,使用touchmove事件来移动实际<e
浏览 1
提问于2022-01-23
得票数 0
1
回答
如何
提高
我
的
SSD
性能
?
、
我
使用超越120 GB
的
SSD驱动器与1-TB硬盘驱动器.
我
的
机器是戴尔Inspiron-5567 (笔记本电脑)。Ram 12-GB与2-GB交换内存从SSD驱动器.现在
我
要问
的
是,
我
可以使用修剪技术吗?修剪技术有什么缺点吗?
浏览 0
提问于2019-06-27
得票数 0
1
回答
如何
提高
我
的
Regex
性能
、
、
我
试图解析
的
行是:
我
想要获取
的
信息:
我
创建
的</
浏览 0
提问于2019-04-09
得票数 1
回答已采纳
1
回答
如何
提高
我
的
查询
性能
?
、
、
、
、
我们已经编写了一个类似下面的查询,并且还在表上创建了适当
的
索引。我们尝试在where子句列上添加索引,但仍然在可能
的
情况下执行full scan .Please重写查询。
浏览 1
提问于2013-11-29
得票数 0
2
回答
如何
提高
我
的
网页
性能
?
、
我
目前在一个非常重
的
网页上工作,其中包含一个弹出式窗口&这个弹出式窗口包含多个选项卡。每个选项卡上都有多个按钮。点击一个按钮打开一个新
的
弹出式窗口,然后打开一个新
的
弹出式窗口。
我
正在使用RadWindow打开一个嵌套弹出窗口。但是,
我
正经历着非常糟糕
的
表现。有没有更好
的
方法来实现这一点,无论是否使用radwindow来显示弹出窗口。
浏览 2
提问于2011-04-08
得票数 0
回答已采纳
1
回答
如何
提高
我
的
UITableView
的
性能
、
、
、
我
有一个UITableView,它从一个防火墙数据库中加载图像。表中
的
每个单元格包含三幅图片。防火墙查询一次加载三个文档,而当用户滚动到底部时,表视图将分页。
我
遇到
的
问题是,当我滚动表视图时,每次它到达一个新单元格时都会结巴。每个单元格所占
的
比例略高于整个屏幕。下面是
我
试图描述
的
一个例子:func paginate(){ postQuery = postQuery.start(afterDocument: docu
浏览 3
提问于2021-02-01
得票数 0
回答已采纳
1
回答
在线
DQN
模式能否过关?
、
、
我
是新
的
领域
的
RL,目前试图培训一个在线
的
DQN
模式。一个在线模型会不会因为它一直在学习而变得过于适合?
我
怎么知道会不会发生这种事?
浏览 0
提问于2021-09-22
得票数 1
1
回答
如果
DQN
测试
的
奖励低于
DQN
最小化问题训练
的
奖励,是否可以接受?
、
、
如果我们训练一个
DQN
超过40000-60000集
的
500个时间步调。在过去
的
100步训练中,在测试过程中,奖励
的
平均值约为奖励
的
1.1倍。越多
的
时间步骤应该更稳定??时间步数
的
作用是什么? 例如,在最后100次
的
训练中,奖励
的
平均值是6.1,但是在测试期间
的
答案是5.2 (
我
的
问题是最小化)。我们
的
DQN
还好
浏览 0
提问于2018-10-14
得票数 0
1
回答
提高
我
的
网站
性能
、
、
、
、
我
有一个静态唯一
的
网站,这是谷歌应用引擎托管。它
的
前面是Cloudflare CDN。 以下是两种类型
的
推荐:2)利用浏览器缓存 对于问
浏览 1
提问于2016-09-11
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
如何提高云计算的性能
提高JavaScript动画的性能
如何提高装配体性能
谷歌实现2种新的强化学习算法,“比肩”DQN,泛化性能更佳
如何提高AI芯片性能?看华为设计中的“快速通道”
热门
标签
更多标签
云服务器
ICP备案
云直播
对象存储
腾讯会议
活动推荐
运营活动
广告
关闭
领券