腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
将RNN的隐藏状态传递给另一个RNN
rnn
、
reinforcement-learning
、
backpropagation
我正在使用
强化
学习
教一个人工智能,一个奥地利纸牌游戏,与不完美的信息,称为施纳普森。对于不同的游戏状态,我有不同的
神经网络
(使用不同的特征)来计算值/策略。然而,当我使用多个
神经网络
时,我需要不断地将隐藏状态从一个RNN转移到另一个RNN。我不能完全做到这一点,特别是在训练期间,我不知道如何通过时间进行反向传播。
浏览 0
提问于2021-10-11
得票数 1
3
回答
在深度
强化
学习
中,
神经网络
的设计是否有经验法则?
machine-learning
、
neural-network
、
reinforcement-learning
在深入
学习
中,我们可以用损失函数值来评估模型的性能,并通过K倍交叉验证等方法来提高模型的性能。但是,如何设计和优化
神经网络
在深度
强化
学习
中的应用呢?我们可以用奖励等来评估
强化
学习
算法本身的性能,但是如何保证
神经网络
在
强化
学习
算法中的应用是好的还是坏的呢?
浏览 0
提问于2019-02-08
得票数 3
1
回答
您能否将
强化
学习
添加到卷积
神经网络
中以改进图像分类?
image-processing
、
conv-neural-network
、
reinforcement-learning
我对机器和深度
学习
非常陌生。我的疑问是,如何将
强化
学习
添加到使用传统
神经网络
开发的图像分类器中,以随着时间的推移提高其性能?
浏览 23
提问于2020-05-10
得票数 0
4
回答
神经网络
真的被抛弃了吗?
neural-network
、
reinforcement-learning
我计划使用
神经网络
来逼近
强化
学习
算法中的值函数。我想这样做是为了对我如何表示状态和行为引入一些概括和灵活性。谢谢, 图努兹
浏览 6
提问于2011-08-02
得票数 6
回答已采纳
1
回答
在openai健身房中创建自定义环境,并以游戏屏幕为观察对象
reinforcement-learning
、
openai-gym
我用PyGame做了一个游戏。我想使用游戏屏幕的输出作为观察的自定义,而不是一组距离和角度。(我已经看到了定制环境的文档,但在那个观察中并没有游戏屏幕)。
浏览 0
提问于2020-05-26
得票数 0
2
回答
无训练值的
神经网络
学习
machine-learning
、
reinforcement-learning
、
neural-network
我想知道如何在不提供训练值的情况下训练
神经网络
。我的前提是,
神经网络
将用于可以从传感器接收正/负反馈的机器人上。如何使用这种方法训练
神经网络
? 我正在用C++写这篇文章
浏览 2
提问于2012-01-26
得票数 2
回答已采纳
1
回答
强化
学习
中的问题:错误、参数调整和训练周期
neural-network
、
reinforcement-learning
我目前正在训练一个
强化
学习
智能体,使用100个隐藏元素的简单
神经网络
来解决2048游戏。我使用的是DQN的
强化
学习
算法(即带有重放记忆的Q
学习
),但使用的是两层
神经网络
,而不是深度
神经网络
。
浏览 0
提问于2016-06-19
得票数 0
2
回答
Python
神经网络
强化
学习
python
、
machine-learning
、
scikit-learn
、
reinforcement-learning
我想做一个
神经网络
,利用
强化
学习
在python中进行训练。目前我正在使用Scikit--
学习
,但似乎没有所有的
神经网络
东西都试图将yEstimate与yTarget相匹配。
浏览 6
提问于2015-12-24
得票数 7
回答已采纳
1
回答
如何用不同的模型对基于DQN的深度
神经网络
进行
强化
学习
?
neural-network
、
reinforcement-learning
、
unsupervised-learning
、
deep-learning
如果不使用深层
神经网络
(DNN)来实现
强化
学习
算法,比如深度Q-网络(DQN),可以实现吗?在下面的DQN伪码中,如果我想用另一种无监督算法替换DNN部分,它可能吗?
浏览 0
提问于2018-08-31
得票数 3
1
回答
在深入
强化
学习
的背景下,批量大小的含义是什么?
reinforcement-learning
、
batchsize
批次大小是指在监督
学习
中接受神经工作训练的样本数,但是,在
强化
学习
的背景下,批次大小的意义是什么?它也是指样品吗?如果是的话,在
强化
学习
的背景下,样本的意义是什么?
浏览 0
提问于2019-04-02
得票数 3
回答已采纳
3
回答
强化
学习
工具
reinforcement-learning
Tensorforce、Kerasrl和chainerrl用于
强化
学习
的区别是什么?据我所知,这三种方法都与OpenAI健身房环境有关,并且具有相同的
强化
学习
算法。在表现上有什么不同吗?
浏览 1
提问于2018-09-10
得票数 1
2
回答
为了编写一个简单的人工智能程序来玩游戏,我需要什么知识?
machine-learning
、
algorithms
、
beginner
、
reinforcement-learning
、
training
我的课程之一是“机器
学习
入门”,我一直想在这门课上做一个个人项目。为了训练一个简单的人工智能程序来玩游戏,我需要获得什么知识?这是我目前在机器
学习
中所知道的-统计推断可能是近似正确的模型,包括泛化界和模型选择。支持向量机(SVM)促进弱
学习
者向强
学习
者
学习
: AdaBoost回归决策树 决策树修剪与随机林
浏览 0
提问于2017-01-04
得票数 9
回答已采纳
1
回答
Microsoft CNTK增强
学习
C++示例
c++
、
neural-network
、
reinforcement-learning
、
cntk
我目前正在尝试用C++编写一个扮演炸弹人的人工智能,我想用CNTK将其实现为
神经网络
(
强化
学习
)。该工具包有很多教程和示例,甚至有一个用于
强化
学习
,但它是用python编写的,我不知道。有没有使用CNTK教授
强化
学习
的实用C++示例或教程? 我最关心的第一个问题是如何使用CNTK C++ api创建模型。
浏览 2
提问于2017-06-06
得票数 3
1
回答
人工
神经网络
中的无监督
学习
machine-learning
、
artificial-intelligence
、
neural-network
、
unsupervised-learning
如果我要用遗传算法训练一个人工
神经网络
的权重,这是什么类型的
学习
呢?我相信它是无人监管的但它有名字吗?它似乎可能属于
强化
学习
,但我不太确定。
浏览 4
提问于2014-02-23
得票数 1
回答已采纳
1
回答
整洁与
强化
学习
的关系是什么?
machine-learning
、
artificial-intelligence
、
difference
、
reinforcement-learning
、
evolutionary-algorithm
据我所知,train (增强拓扑的NeuroEvolution)是一种利用进化的概念来训练
神经网络
的算法。另一方面,
强化
学习
是一种机器
学习
,其概念是“奖励”更成功的节点。还是从
强化
学习
中衍生出来的整洁?
浏览 2
提问于2017-02-18
得票数 7
回答已采纳
1
回答
我可以在tensorflowjs中使用
强化
学习
吗?
javascript
、
machine-learning
、
neural-network
、
reinforcement-learning
、
tensorflowjs
我目前正在做一个项目,它需要tensorflowjs创建一个从
强化
学习
算法中
学习
的
神经网络
。这有可能做到吗?
浏览 33
提问于2019-06-26
得票数 1
回答已采纳
2
回答
基于
强化
学习
的
神经网络
训练
algorithm
、
language-agnostic
、
machine-learning
、
neural-network
、
reinforcement-learning
我知道前馈
神经网络
的基本知识,以及如何使用反向传播算法来训练它们,但我正在寻找一种比我能用来训练
神经网络
的
强化
学习
的算法。另一种情况类似于,在这种情况下,反馈被延迟,只限于目标和反目标,而不是奖励。它们也可能适用于第二种情况,但速度慢得令人难以置信,不利于在线
学习
。 我的问题很简单:是否有一个简单的算法来训练带有
强化
学习</
浏览 1
提问于2012-05-23
得票数 67
回答已采纳
1
回答
强化
学习
中的
神经网络
设置与监控
neural-network
、
artificial-intelligence
、
reinforcement-learning
我有几个关于使用
强化
学习
训练
神经网络
的问题,例如,DQN: 1.在定义我们的模型时,我们应该使用正则化器还是辍学? 2.我们可以在
学习
阶段监控什么?
浏览 0
提问于2019-02-06
得票数 0
1
回答
神经网络
与RC船
neural-network
、
robotics
让我们假设我家里有一个很大的水池--我有一艘装有非常敏感和精确的GPS的小型RC船和一台装有SD卡模块的微型计算机来加载/保存
神经网络
数据。 在训练期间,我不知道是应该使用监督方法(rc船,我可以在一开始就控制它),还是非监督
学习
?如果是的话,我是否应该进行监督
学习
(向网络展示如何导航到单个wpt多次,以至于网络
学习
了它,然后使用这个网络自主导航到其他wpt?)
浏览 0
提问于2016-06-26
得票数 1
1
回答
什么是
神经网络
中的蒙特卡洛波束搜索?
monte-carlo-tree-search
、
beam-search
蒙特卡洛波束搜索在
神经网络
和
强化
学习
的研究中经常被引用。它是什么?它与蒙特卡洛搜索有何不同。
浏览 5
提问于2019-06-05
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
基于神经网络动力学模型的强化学习
DeepMind发布神经网络、强化学习库,网友:推动JAX发展
强化学习新模型Jumper,让神经网络学习在阅读中何时做决定
基于深度强化学习和卷积神经网络的遥感飞机目标检测
深度学习与强化学习
热门
标签
更多标签
云服务器
即时通信 IM
ICP备案
对象存储
实时音视频
活动推荐
运营活动
广告
关闭
领券