C++强化学习和智能指针 - 腾讯云开发者社区

文章/答案/技术大牛

发布

1回答

Microsoft CNTK增强学习C++示例

c++、neural-network、reinforcement-learning、cntk

我目前正在尝试用C++编写一个扮演炸弹人的人工智能，我想用CNTK将其实现为神经网络(强化学习)。该工具包有很多教程和示例，甚至有一个用于强化学习，但它是用python编写的，我不知道。有没有使用CNTK教授强化学习的实用C++示例或教程？我最关心的第一个问题是如何使用CNTK C++ api创建模型。

浏览 2提问于2017-06-06得票数 3

3回答

C++强化学习与智能指针

c++、smart-pointers、reinforcement-learning

我正在做我的硕士项目机器人的感觉运动在线学习使用强化学习方法(Q，sarsa，TD(λ)，演员评论家，R等)。我目前正在设计一个框架，在这个框架上，高级强化学习和底层机器人API控制都将被使用。由于这会产生大量的问题、bug等，而且由于并行化(即线程化)是我想探索的强化学习的一个方面，所以我还不确定要使用什么样的智能指针。为智能指针设计自己的模板/类需要时间和<

浏览 6提问于2011-07-06得票数 6

2回答

强化学习算法

machine-learning、reinforcement-learning

我想用强化学习机器学习的方法来研究和开发一些应用。我已经熟悉使用监督学习的分类问题。谢谢!

浏览 0提问于2021-11-15得票数 0

回答已采纳

1回答

智能指针vs自动引用计数

c++、objective-c、c++11、automatic-ref-counting、smart-pointers

我对Objective-C和自动引用计数的了解非常清楚。最近我正在学习C++，智能指针。我发现智能指针和自动引用计数非常相似。虽然我找不到使用C++和Objective-C的代码示例和自动引用计数的智能指针和自动引用计数的并列比较(相似和不同之处)。那么谁能给我一个详细的解释呢？编辑:在这里，通过智能指

浏览 1提问于2016-11-07得票数 1

1回答

制定奖励结构

artificial-intelligence、reinforcement-learning、montecarlo、reward、dqn

我对强化学习和训练强化学习智能体的实验都很陌生。直觉上，我觉得这将有助于培训代理，但这种倾斜的奖励结构会有什么缺点吗？

浏览 11提问于2019-11-26得票数 0

1回答

基于强化学习的多目标优化

machine-learning、power-management、reinforcement-learning

我有一个单一的目标函数，它具有两个目标的线性加权和：我正在使用Q-learning通过改变权重

浏览 2提问于2012-11-12得票数 3

回答已采纳

1回答

如何用强化学习算法建立实时控制器

tensorflow、real-time

我正在尝试使用强化学习来控制一个实际的机器人操纵器。对于强化学习，我使用的是Google tensorflow。C++中有没有使用Tensorflow强化<em

浏览 0提问于2019-04-01得票数 0

2回答

为了编写一个简单的人工智能程序来玩游戏，我需要什么知识？

machine-learning、algorithms、beginner、reinforcement-learning、training

我的课程之一是“机器学习入门”，我一直想在这门课上做一个个人项目。为了训练一个简单的人工智能程序来玩游戏，我需要获得什么知识？这是我目前在机器学习中所知道的-统计推断可能是近似正确的模型，包括泛化界和模型选择。基本的超平面算法:感知器和Winnow。核粒促进弱

浏览 0提问于2017-01-04得票数 9

回答已采纳

3回答

强化学习工具

reinforcement-learning

Tensorforce、Kerasrl和chainerrl用于强化学习的区别是什么？据我所知，这三种方法都与OpenAI健身房环境有关，并且具有相同的强化学习算法。在表现上有什么不同吗？

浏览 1提问于2018-09-10得票数 1

1回答

使用强化学习的数学测验应用程序

python、recommendation-engine

我想开发一个使用强化学习的数学测验程序。假设我们手头有1000个问题，每个测验要问25个问题。程序必须从用户回答和提出下一个问题的方式中学习，而不是随机提问。测验程序应该是一种强化学习智能体。要使用哪些强化学习技术？示例: BoT:什么是机器人1:用户:3(错误答案) 5+：问了一个简单的问题，或者正确答案问了一个困难的问题。

浏览 0提问于2018-12-31得票数 0

2回答

人工智能图书馆

c++、algorithm、machine-learning、artificial-intelligence、game-ai

我正在寻找在游戏中有用的人工智能算法的C和C++实现。我最感兴趣的是强化学习算法、遗传算法和神经网络。然而，任何其他的都是有趣的。我发现dlib.net有一些非常吸引人的机器学习算法，但这些算法似乎并不特别适合于游戏。我可以使用的许可证是Boost Software License、Zlib/Libpng许可证和公共域。

浏览 1提问于2013-05-27得票数 6

1回答

倒立摆:基于模型还是无模型？

reinforcement-learning

例如:假设我正在对倒立摆应用Q学习，其中奖励是以摆向上位置之间的绝对距离给出的，而终端状态(或目标状态)被定义为当摆非常接近向上位置时。这个设置是否意味着我有一个无模型的或基于模型的设置？

浏览 1提问于2018-05-02得票数 1

1回答

学习率将wrt衰减为累积奖励？

reinforcement-learning、dqn

在深度强化学习中，有没有办法将学习率wrt衰减为累积奖励？我的意思是，当智能体能够学习并最大化奖励时，衰减学习率？

浏览 18提问于2020-06-18得票数 0

1回答

如何应用强化学习？

artificial-intelligence、reinforcement-learning

你有一个代理和一个环境。然后你有一组状态，每个状态都有一个值。然后，智能体要么选择“探索”，要么选择“利用”，并根据发生的事情修改其知识。

浏览 1提问于2013-11-13得票数 2

9回答

强化学习的良好实现？

language-agnostic、artificial-intelligence、machine-learning、reinforcement-learning

对于一个人工智能项目，我需要实现一个强化学习算法，这比一个简单的俄罗斯方块游戏。游戏是用Java编写的，我们有源代码。我知道强化学习理论的基本知识，但我想知道在SO社区中是否有人对这类事情有经验。 /

浏览 3提问于2009-04-11得票数 25

回答已采纳

1回答

机器学习如何与大数据相结合？

machine-learning、deep-learning、data-science

机器学习如何与大数据集成?机器学习与MapReduce?What的区别是什么？(有监督学习、无监督学习、强化学习)是决策的主要内容之一，大数据在医疗保健和智能城市决策中的区别是什么？<code>H 111</code>以及大数据与深度学习作为机器学习技术之一的关系？<code>H 212</code><code>G 213<

浏览 3提问于2019-11-14得票数 1

回答已采纳

1回答

是否可以在训练前和训练期间修改OpenAI健身房状态？

machine-learning、artificial-intelligence、openai-gym、openai

我想要做的是修改一个环境，例如，以Super Mario Bros健身房环境为例，模糊智能体训练的图像，看看强化学习智能体是否仍然能够在这些“模糊”状态上学习。 OpenAI使这样的事情成为可能吗？

浏览 38提问于2020-11-11得票数 1

回答已采纳

1回答

C转换问题中的指针和继承？

c++、inheritance、casting

我不明白为什么它不能工作，因为*p_elements和_element都是指针。我觉得这是个演员的问题，但我不知道怎么解决。我尝试了动态转换: bug仍然存在。卡茅斯

浏览 1提问于2012-10-09得票数 0

回答已采纳

1回答

习惯养成人工智能

python、artificial-intelligence

有没有什么好的，基础的，学习人工智能的或者构建人工智能的指南？我使用python来做这件事，但我只是在寻找基础知识，这样我就可以理解他们在做什么。

浏览 0提问于2013-03-01得票数 0

回答已采纳

点击加载更多

Microsoft CNTK增强学习C++示例

C++强化学习与智能指针

强化学习算法

智能指针vs自动引用计数

制定奖励结构

基于强化学习的多目标优化

如何用强化学习算法建立实时控制器

为了编写一个简单的人工智能程序来玩游戏，我需要什么知识？

强化学习工具

使用强化学习的数学测验应用程序

人工智能图书馆

倒立摆:基于模型还是无模型？

学习率将wrt衰减为累积奖励？

如何应用强化学习？

强化学习的良好实现？

机器学习如何与大数据相结合？

是否可以在训练前和训练期间修改OpenAI健身房状态？

C转换问题中的指针和继承？

习惯养成人工智能

热门标签

活动推荐

运营活动

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐