腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
如何将
Drake
与
深度
强化
学习
结合
使用
machine-learning
、
deep-learning
、
simulation
、
robotics
、
drake
drake
有没有实现
深度
强化
学习
算法的管道/平台?
浏览 20
提问于2021-01-28
得票数 0
7
回答
如何实现
深度
强化
学习
(DQN)?
深度学习
、
编程算法
、
强化学习
DQN(Deep Q-Learning)可谓是
深度
强化
学习
(Deep Reinforcement Learning,DRL)的开山之作,是将
深度
学习
与
强化
学习
结合
起来从而实现从感知(Perception)到动作( Action )的端对端(End-to-end)
学习
的一种全新的算法 ,该如何实现
深度
强化
学习
(DQN)呢?
浏览 3314
提问于2018-10-10
2
回答
为什么要将马尔可夫性质引入
强化
学习
?
deep-learning
、
reinforcement-learning
、
markov
作为
深度
强化
学习
的初学者,我很困惑为什么我们应该在
强化
学习
中
使用
马尔可夫过程,以及它给
强化
学习
带来了什么好处。另外,马尔可夫过程要求在“已知”条件下,“现在”
与
“未来”无关。为什么一些
深度
强化
学习
算法可以
使用
RNN和LSTM?这是否违反了马尔可夫过程的假设?
浏览 4
提问于2020-12-23
得票数 0
1
回答
在处理动态交通系统分析任务时,如何提高优化问题?
优化
浏览 102
提问于2022-08-24
回答已采纳
1
回答
如何用不同的模型对基于DQN的
深度
神经网络进行
强化
学习
?
neural-network
、
reinforcement-learning
、
unsupervised-learning
、
deep-learning
如果不
使用
深层神经网络(DNN)来实现
强化
学习
算法,比如
深度
Q-网络(DQN),可以实现吗?在下面的DQN伪码中,如果我想用另一种无监督算法替换DNN部分,它可能吗?
浏览 0
提问于2018-08-31
得票数 3
2
回答
最佳实践设置德雷克的模拟器固定集成时,
使用
强化
学习
?
reinforcement-learning
、
drake
我
使用
drake
进行一些无模型
强化
学习
,我注意到
Drake
在模拟更新时
使用
了一个非固定的步骤集成。当一个物体的加速度很大时,为了在较短的时间内进行多次集成,这是有意义的,但在
使用
强化
学习
的情况下,这会导致一些显着的计算开销和缓慢的展开。我想知道是否有一种原则性的方法允许模拟环境在固定的时间步长集成模式下操作,而不是我目前
使用
的方法(下面的代码)。我目前正在
使用
PyDrake绑定和PPO作为RL算法。
浏览 0
提问于2021-10-20
得票数 2
回答已采纳
1
回答
您能否将
强化
学习
添加到卷积神经网络中以改进图像分类?
image-processing
、
conv-neural-network
、
reinforcement-learning
我对机器和
深度
学习
非常陌生。我的疑问是,
如何将
强化
学习
添加到
使用
传统神经网络开发的图像分类器中,以随着时间的推移提高其性能?
浏览 23
提问于2020-05-10
得票数 0
1
回答
蒙特卡洛是
学习
策略还是价值迭代(或其他东西)?
reinforcement-learning
、
q-learning
、
temporal-difference
、
monte-carlo-tree-search
、
value-iteration
我正在上
强化
学习
课程,我不知道
如何将
策略迭代/值迭代的概念
与
蒙特卡洛(以及TD/SARSA/Q
学习
)相
结合
。
浏览 5
提问于2018-05-08
得票数 2
2
回答
为了编写一个简单的人工智能程序来玩游戏,我需要什么知识?
machine-learning
、
algorithms
、
beginner
、
reinforcement-learning
、
training
我的课程之一是“机器
学习
入门”,我一直想在这门课上做一个个人项目。为了训练一个简单的人工智能程序来玩游戏,我需要获得什么知识?这是我目前在机器
学习
中所知道的-统计推断可能是近似正确的模型,包括泛化界和模型选择。支持向量机(SVM)促进弱
学习
者向强
学习
者
学习
: AdaBoost回归决策树
浏览 0
提问于2017-01-04
得票数 9
回答已采纳
2
回答
强化
学习
算法
machine-learning
、
reinforcement-learning
我想用
强化
学习
机器
学习
的方法来研究和开发一些应用。我已经熟悉
使用
监督
学习
的分类问题。谢谢!
浏览 0
提问于2021-11-15
得票数 0
回答已采纳
1
回答
机器
学习
如何
与
大数据相
结合
?
machine-learning
、
deep-learning
、
data-science
机器
学习
如何
与
大数据集成?机器
学习
与
MapReduce?What的区别是什么?(有监督
学习
、无监督
学习
、
强化
学习
)是决策的主要内容之一,大数据在医疗保健和智能城市决策中的区别是什么?<code>H 111</code>以及大数据
与
深度
学习
作为机器
学习
技术之一的关系?<code>H 212</code><cod
浏览 3
提问于2019-11-14
得票数 1
回答已采纳
3
回答
强化
学习
工具
reinforcement-learning
Tensorforce、Kerasrl和chainerrl用于
强化
学习
的区别是什么?据我所知,这三种方法都与OpenAI健身房环境有关,并且具有相同的
强化
学习
算法。在表现上有什么不同吗?
浏览 1
提问于2018-09-10
得票数 1
1
回答
调整评估函数的权重
artificial-intelligence
、
minimax
我有有限的时间和硬件,所以我的问题是:在评估的质量方面,基于
使用
较低
深度
搜索获得的结果执行“训练”和调整权重是否非常糟糕,而不是当AI在有更多时间并因此可以在更深层次上搜索游戏树的情况下必须表现最佳时
使用
的结果
浏览 0
提问于2011-03-21
得票数 0
1
回答
深度
强化
学习
的大动作空间
deep-learning
、
reinforcement-learning
我知道在正常的
深度
强化
学习
(DRL)场景中,我们
学习
了一个深层神经网络来将当前状态映射到Q值。Q值的数目(神经网络输出的#)
与
可能的动作数相同,因此我们可以根据相关的Q值选择动作。然而,在本文"基于组合动作空间的
深度
强化
学习
预测流行Reddit线程“中,作者
使用
状态和动作作为输入。网络只输出一个Q值(见下图)。
浏览 0
提问于2019-04-16
得票数 6
1
回答
将DNN模型发送到Watson进行训练时打开数据文件时出错
ibm-watson
、
watson-studio
我的火车设置为pickle文件(.p),在我的模型代码中,我打开该文件并开始
使用
它,然后在它上进行训练。然而,当我开始培训时,我收到了这个错误消息,我似乎找不到问题所在。
浏览 15
提问于2019-06-25
得票数 0
2
回答
Pytorch -在eval()和train()模式之间来回往返
python
、
neural-network
、
deep-learning
、
pytorch
、
reinforcement-learning
我正在
学习
“
深度
强化
学习
”,并在pytorch的
强化
学习
(DQN)教程之后构建我自己的示例。据我所知,在
使用
BatchNorm1d时,必须执行model.eval()才能
使用
模型,因为eval()和train()模式有不同的结果。在训练分类神经网络时,model.eval()只在训练结束后进行,但在“
深度
强化
学习
”的情况下,通常采用策略,然后继续优化过程。 我想知道不同模式之间的来回是否对优化过程是
浏览 3
提问于2019-10-18
得票数 3
回答已采纳
1
回答
Grover算法在机器
学习
中的应用
machine-learning
、
quantum-computing
我想知道在机器
学习
(
深度
学习
,NLP和
强化
学习
)中,我可以在哪里
使用
grover算法。
浏览 33
提问于2021-01-31
得票数 1
1
回答
GPU是否缩短了策略RL的培训时间?
reinforcement-learning
、
gpu
、
policy-gradients
我想知道
使用
GPU是否会有效,如果我
使用
的政策(如PPO) RL作为模型?我最近训练了一个模型,GPU的利用率约为2%。
浏览 0
提问于2021-10-13
得票数 1
回答已采纳
2
回答
信息提取
结合
强化
学习
,可行吗?
text-mining
、
reinforcement-learning
、
parsing
、
named-entity-recognition
我想知道是否可以
使用
强化
学习
(因为它将越来越流行的谷歌DeepMind &AlphaGo的东西)来解析和提取文本信息。也许它会学到“单词”中的相邻字母都有相同的标签,等等,它能用这种方法来
学习
长期的依赖关系吗? 我对任何
与
这一主题有关的想法或参考感兴趣。
浏览 0
提问于2016-03-12
得票数 4
回答已采纳
1
回答
基于
强化
深度
学习
的目标检测
deep-learning
、
neural-network
、
reinforcement-learning
、
computer-vision
、
convolutional-neural-network
在阅读了
使用
CNN(R,较快R,YOLO,YOLOv2,SSD)的目标检测技术的最新进展之后,我想知道是否有一种有效的方法将
深度
学习
和
强化
学习
用于对象检测?
浏览 0
提问于2018-02-23
得票数 0
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
深度学习与强化学习
深度学习第57讲:深度强化学习与深度Q网络
将深度学习与GIS相结合
机器学习实践:如何将Spark与Python结合?
深度强化学习模型的研究与应用
热门
标签
更多标签
云服务器
ICP备案
实时音视频
对象存储
云直播
活动推荐
运营活动
广告
关闭
领券