腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
1
回答
Microsoft CNTK增强
学习
C++
示例
c++
、
neural-network
、
reinforcement-learning
、
cntk
我目前正在尝试用
C++
编写一个扮演炸弹人的人工
智能
,我想用CNTK将其实现为神经网络(
强化
学习
)。该工具包有很多教程
和
示例,甚至有一个用于
强化
学习
,但它是用python编写的,我不知道。有没有使用CNTK教授
强化
学习
的实用
C++
示例或教程? 我最关心的第一个问题是如何使用CNTK
C++
api创建模型。
浏览 2
提问于2017-06-06
得票数 3
3
回答
C++
强化
学习
与
智能
指针
c++
、
smart-pointers
、
reinforcement-learning
我正在做我的硕士项目机器人的感觉运动在线
学习
使用
强化
学习
方法(Q,sarsa,TD(λ),演员评论家,R等)。我目前正在设计一个框架,在这个框架上,高级
强化
学习
和
底层机器人API控制都将被使用。由于这会产生大量的问题、bug等,而且由于并行化(即线程化)是我想探索的
强化
学习
的一个方面,所以我还不确定要使用什么样的
智能
指针
。 为
智能
指针
设计自己的模板/类需要时间
和<
浏览 6
提问于2011-07-06
得票数 6
2
回答
强化
学习
算法
machine-learning
、
reinforcement-learning
我想用
强化
学习
机器
学习
的方法来研究
和
开发一些应用。我已经熟悉使用监督
学习
的分类问题。谢谢!
浏览 0
提问于2021-11-15
得票数 0
回答已采纳
1
回答
智能
指针
vs自动引用计数
c++
、
objective-c
、
c++11
、
automatic-ref-counting
、
smart-pointers
我对Objective-C
和
自动引用计数的了解非常清楚。最近我正在
学习
C++
,
智能
指针
。我发现
智能
指针
和
自动引用计数非常相似。虽然我找不到使用
C++
和
Objective-C的代码示例
和
自动引用计数的
智能
指针
和
自动引用计数的并列比较(相似
和
不同之处)。那么谁能给我一个详细的解释呢?编辑:在这里,通过
智能
指
浏览 1
提问于2016-11-07
得票数 1
1
回答
制定奖励结构
artificial-intelligence
、
reinforcement-learning
、
montecarlo
、
reward
、
dqn
我对
强化
学习
和
训练
强化
学习
智能
体的实验都很陌生。直觉上,我觉得这将有助于培训代理,但这种倾斜的奖励结构会有什么缺点吗?
浏览 11
提问于2019-11-26
得票数 0
1
回答
基于
强化
学习
的多目标优化
machine-learning
、
power-management
、
reinforcement-learning
我有一个单一的目标函数,它具有两个目标的线性加权
和
:我正在使用Q-learning通过改变权重
浏览 2
提问于2012-11-12
得票数 3
回答已采纳
1
回答
如何用
强化
学习
算法建立实时控制器
tensorflow
、
real-time
我正在尝试使用
强化
学习
来控制一个实际的机器人操纵器。对于
强化
学习
,我使用的是Google tensorflow。
C++
中有没有使用Tensorflow
强化
<em
浏览 0
提问于2019-04-01
得票数 0
2
回答
为了编写一个简单的人工
智能
程序来玩游戏,我需要什么知识?
machine-learning
、
algorithms
、
beginner
、
reinforcement-learning
、
training
我的课程之一是“机器
学习
入门”,我一直想在这门课上做一个个人项目。为了训练一个简单的人工
智能
程序来玩游戏,我需要获得什么知识?这是我目前在机器
学习
中所知道的-统计推断可能是近似正确的模型,包括泛化界
和
模型选择。基本的超平面算法:感知器
和
Winnow。核粒 促进弱
浏览 0
提问于2017-01-04
得票数 9
回答已采纳
3
回答
强化
学习
工具
reinforcement-learning
Tensorforce、Kerasrl
和
chainerrl用于
强化
学习
的区别是什么?据我所知,这三种方法都与OpenAI健身房环境有关,并且具有相同的
强化
学习
算法。在表现上有什么不同吗?
浏览 1
提问于2018-09-10
得票数 1
1
回答
使用
强化
学习
的数学测验应用程序
python
、
recommendation-engine
我想开发一个使用
强化
学习
的数学测验程序。假设我们手头有1000个问题,每个测验要问25个问题。程序必须从用户回答
和
提出下一个问题的方式中
学习
,而不是随机提问。 测验程序应该是一种
强化
学习
智能
体。要使用哪些
强化
学习
技术?示例: BoT:什么是机器人1:用户:3(错误答案) 5+:问了一个简单的问题,或者正确答案问了一个困难的问题。
浏览 0
提问于2018-12-31
得票数 0
2
回答
人工
智能
图书馆
c++
、
algorithm
、
machine-learning
、
artificial-intelligence
、
game-ai
我正在寻找在游戏中有用的人工
智能
算法的C
和
C++
实现。我最感兴趣的是
强化
学习
算法、遗传算法
和
神经网络。然而,任何其他的都是有趣的。我发现dlib.net有一些非常吸引人的机器
学习
算法,但这些算法似乎并不特别适合于游戏。 我可以使用的许可证是Boost Software License、Zlib/Libpng许可证
和
公共域。
浏览 1
提问于2013-05-27
得票数 6
1
回答
倒立摆:基于模型还是无模型?
reinforcement-learning
例如:假设我正在对倒立摆应用Q
学习
,其中奖励是以摆向上位置之间的绝对距离给出的,而终端状态(或目标状态)被定义为当摆非常接近向上位置时。 这个设置是否意味着我有一个无模型的或基于模型的设置?
浏览 1
提问于2018-05-02
得票数 1
1
回答
学习
率将wrt衰减为累积奖励?
reinforcement-learning
、
dqn
在深度
强化
学习
中,有没有办法将
学习
率wrt衰减为累积奖励?我的意思是,当
智能
体能够
学习
并最大化奖励时,衰减
学习
率?
浏览 18
提问于2020-06-18
得票数 0
1
回答
如何应用
强化
学习
?
artificial-intelligence
、
reinforcement-learning
你有一个代理
和
一个环境。然后你有一组状态,每个状态都有一个值。然后,
智能
体要么选择“探索”,要么选择“利用”,并根据发生的事情修改其知识。
浏览 1
提问于2013-11-13
得票数 2
9
回答
强化
学习
的良好实现?
language-agnostic
、
artificial-intelligence
、
machine-learning
、
reinforcement-learning
对于一个人工
智能
项目,我需要实现一个
强化
学习
算法,这比一个简单的俄罗斯方块游戏。游戏是用Java编写的,我们有源代码。我知道
强化
学习
理论的基本知识,但我想知道在SO社区中是否有人对这类事情有经验。 /
浏览 3
提问于2009-04-11
得票数 25
回答已采纳
1
回答
机器
学习
如何与大数据相结合?
machine-learning
、
deep-learning
、
data-science
机器
学习
如何与大数据集成?机器
学习
与MapReduce?What的区别是什么?(有监督
学习
、无监督
学习
、
强化
学习
)是决策的主要内容之一,大数据在医疗保健
和
智能
城市决策中的区别是什么?<code>H 111</code>以及大数据与深度
学习
作为机器
学习
技术之一的关系?<code>H 212</code><code>G 213<
浏览 3
提问于2019-11-14
得票数 1
回答已采纳
1
回答
是否可以在训练前
和
训练期间修改OpenAI健身房状态?
machine-learning
、
artificial-intelligence
、
openai-gym
、
openai
我想要做的是修改一个环境,例如,以Super Mario Bros健身房环境为例,模糊
智能
体训练的图像,看看
强化
学习
智能
体是否仍然能够在这些“模糊”状态上
学习
。 OpenAI使这样的事情成为可能吗?
浏览 38
提问于2020-11-11
得票数 1
回答已采纳
1
回答
C转换问题中的
指针
和
继承?
c++
、
inheritance
、
casting
我不明白为什么它不能工作,因为*p_elements
和
_element都是
指针
。我觉得这是个演员的问题,但我不知道怎么解决。我尝试了动态转换: bug仍然存在。卡茅斯
浏览 1
提问于2012-10-09
得票数 0
回答已采纳
1
回答
习惯养成人工
智能
python
、
artificial-intelligence
有没有什么好的,基础的,
学习
人工
智能
的或者构建人工
智能
的指南?我使用python来做这件事,但我只是在寻找基础知识,这样我就可以理解他们在做什么。
浏览 0
提问于2013-03-01
得票数 0
回答已采纳
点击加载更多
热门
标签
更多标签
云服务器
对象存储
ICP备案
云点播
腾讯会议
活动推荐
运营活动
广告
关闭
领券