腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
将RNN的隐藏状态传递给另一个RNN
rnn
、
reinforcement-learning
、
backpropagation
我正在使用强
化学
习教一个人工智能,一个奥地利纸牌游戏,与不完美的信息,称为施纳普森。对于不同的游戏状态,我有不同的神经
网络
(使用不同的特征)来计算值/策略。然而,当我使用多个神经
网络
时,我需要不断地将隐藏状态从一个RNN转移到另一个RNN。我不能完全做到这一点,特别是在训练期间,我不知道如何通过时间进行反向传播。
浏览 0
提问于2021-10-11
得票数 1
1
回答
适用于Azure VM的SLA只适用于一个地区的一个有效区域
azure
、
microsoft
、
sla
当在一个区域中只有一个可用区域时,我希望在Microsoft中获得Microsoft用于
虚拟
机。下面的二语
习
得只在至少有2个可用区域时描述SLA。非常感谢。
浏览 0
提问于2019-11-08
得票数 0
1
回答
如何在同一范围内对所有参数的数据进行规范化
normalization
、
normalize
我有csv文件,产量: 1172.4,1712.7,863.88,2731.34,5220
虚拟
(Types_of_soil):1,0,0,2,10 ==>深黑色因变量( y):产量所以,我想规范这个数据,如何在1到10的范围内缩放数据?我试着用公式:(
习
-分钟)/(最大-分钟)是正确的吗? 以及如何为二进制变量(
虚拟
变量)缩放数据
浏览 3
提问于2017-02-04
得票数 0
回答已采纳
3
回答
在深度强
化学
习中,神经
网络
的设计是否有经验法则?
machine-learning
、
neural-network
、
reinforcement-learning
但是,如何设计和优化神经
网络
在深度强
化学
习中的应用呢?我们可以用奖励等来评估强
化学
习算法本身的性能,但是如何保证神经
网络
在强
化学
习算法中的应用是好的还是坏的呢?
浏览 0
提问于2019-02-08
得票数 3
1
回答
您能否将强
化学
习添加到卷积神经
网络
中以改进图像分类?
image-processing
、
conv-neural-network
、
reinforcement-learning
我的疑问是,如何将强
化学
习添加到使用传统神经
网络
开发的图像分类器中,以随着时间的推移提高其性能?
浏览 23
提问于2020-05-10
得票数 0
1
回答
在openai健身房中创建自定义环境,并以游戏屏幕为观察对象
reinforcement-learning
、
openai-gym
我用PyGame做了一个游戏。我想使用游戏屏幕的输出作为观察的自定义,而不是一组距离和角度。(我已经看到了定制环境的文档,但在那个观察中并没有游戏屏幕)。
浏览 0
提问于2020-05-26
得票数 0
1
回答
使用TFRecord格式的裁剪图像有什么负面影响吗?
tensorflow
TensorFlow对象检测应用编程接口要求TFRecord图像裁剪属性,如下所示: { 'image/width': 2400, 'image/source_id': 'image1.jpg', 'image/format': &
浏览 19
提问于2021-06-18
得票数 0
回答已采纳
1
回答
如何用不同的模型对基于DQN的深度神经
网络
进行强
化学
习?
neural-network
、
reinforcement-learning
、
unsupervised-learning
、
deep-learning
如果不使用深层神经
网络
(DNN)来实现强
化学
习算法,比如深度Q-
网络
(DQN),可以实现吗?在下面的DQN伪码中,如果我想用另一种无监督算法替换DNN部分,它可能吗?
浏览 0
提问于2018-08-31
得票数 3
2
回答
无训练值的神经
网络
学习
machine-learning
、
reinforcement-learning
、
neural-network
我想知道如何在不提供训练值的情况下训练神经
网络
。我的前提是,神经
网络
将用于可以从传感器接收正/负反馈的机器人上。如何使用这种方法训练神经
网络
? 我正在用C++写这篇文章
浏览 2
提问于2012-01-26
得票数 2
回答已采纳
1
回答
利用机器学习进行优化的项目
machine-learning
我想做一个网站项目,使用机器学习,以优化汽车吞吐量在一个城市。这将是一个卡通网格的点试图导航通过一个网格的街道与红灯在每个十字路口。但是,我还没有找到正确的资源来学习这种类型的ML优化。我做过谷歌ML速成班和“人工智能程序员指南”一书,但我还没有找到我正在寻找的合适类型的ML。我正在寻找一个学习资源来训练一个没有标签数据的模型,并提供一个优化的度量。
浏览 8
提问于2022-08-23
得票数 -2
回答已采纳
1
回答
这些信息是否足以完全定义一个神经
网络
?
neural-network
、
tensorflow
背景:我想尝试实现这个
网络
作为学习神经
网络
和TensorFlow的第一个项目。问题:非
化学
家数据的本文考虑了一种特殊类型的
化学
反应。这种
化学
反应有成千上万种可能的组合。我们有数据,每个组合与反应产率成对,一个介于0到1之间的
浏览 0
提问于2019-01-09
得票数 1
1
回答
JavaScript自动排列图形引擎
javascript
、
canvas
我的一位
化学
导师朋友想出了一个
网络
应用程序的想法,它可以在
化学
结构被操纵时以交互方式显示它。它不需要准确,它只意味着交互地显示基本
化学
,在这种
化学
中,所有元素都试图相互连接,以完成它们最外层的键。
浏览 2
提问于2011-07-23
得票数 1
回答已采纳
4
回答
神经
网络
真的被抛弃了吗?
neural-network
、
reinforcement-learning
我计划使用神经
网络
来逼近强
化学
习算法中的值函数。我想这样做是为了对我如何表示状态和行为引入一些概括和灵活性。谢谢, 图努兹
浏览 6
提问于2011-08-02
得票数 6
回答已采纳
2
回答
Python神经
网络
强
化学
习
python
、
machine-learning
、
scikit-learn
、
reinforcement-learning
我想做一个神经
网络
,利用强
化学
习在python中进行训练。目前我正在使用Scikit--学习,但似乎没有所有的神经
网络
东西都试图将yEstimate与yTarget相匹配。
浏览 6
提问于2015-12-24
得票数 7
回答已采纳
1
回答
没有隐藏层的NN是否表现为回归?
neural-network
、
linear-regression
、
supervised-learning
没有隐藏层的神经
网络
是否表现为回归?没有隐藏层的NN能说我们什么? 例如,如果我们有20个输入和4个输出,而我没有真正的标签,这是否类似于回归?
浏览 0
提问于2018-08-31
得票数 6
2
回答
为了编写一个简单的人工智能程序来玩游戏,我需要什么知识?
machine-learning
、
algorithms
、
beginner
、
reinforcement-learning
、
training
我是B.Sc毕业生。我的课程之一是“机器学习入门”,我一直想在这门课上做一个个人项目。为了训练一个简单的人工智能程序来玩游戏,我需要获得什么知识?对于初学者来说,你推荐什么游戏?课程介绍和机器学习。K-最近邻算法和K-均值算法高斯混合模型(GMM)与期望最大化基本的超平面算法:感知器和Winnow。核粒边缘-感知器PCA决策树修剪与随机林
浏览 0
提问于2017-01-04
得票数 9
回答已采纳
1
回答
在更新神经
网络
权值时,如何解释梯度和偏导数?
machine-learning
、
neural-network
、
gradient-descent
、
calculus
、
stochastic-gradient
我刚刚开始研究神经
网络
,我设法找出了如何推导反传播所需的方程。我花了近3天的时间询问了我所有的教授,并搜索了我能找到的所有东西。
浏览 4
提问于2020-02-26
得票数 0
1
回答
建立
化学
公式的机器学习方法
dataset
、
training
、
model-selection
我们在
化学
公司工作。我们有近3000种
化学
配方,由
化学
原料组成。 我们的
化学
配方由20-25种原料组成.正如你猜的那样,这些原材料的数量对我们的配方非常重要。我们的目标是通过使用我们的现有公式来训练一个
网络
,然后我们希望我们的
网络
能够根据我们给出的输入参数来创建新的公式。
浏览 0
提问于2021-01-27
得票数 0
1
回答
为什么在强
化学
习中需要MDP设置
machine-learning
、
deep-learning
、
reinforcement-learning
在许多强
化学
习( RL )论文中,马尔可夫决策过程(MDP)是强
化学
习问题的典型问题集。这种设置的真正好处是什么?一些论文使用LSTM作为其策略
网络
结构,这显然违反了MDP假设,并且更有意义。
浏览 3
提问于2017-04-04
得票数 0
3
回答
强
化学
习工具
reinforcement-learning
Tensorforce、Kerasrl和chainerrl用于强
化学
习的区别是什么?据我所知,这三种方法都与OpenAI健身房环境有关,并且具有相同的强
化学
习算法。在表现上有什么不同吗?
浏览 1
提问于2018-09-10
得票数 1
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
习戈:招商加盟类项目网络推广难吗?有哪些技巧?
使用强化学习简化网络结构
谷歌开源强化学习深度规划网络 PlaNet
网络安全宣传周|达拉特旗网络安全应急指挥中心自制动漫视频之网络安全“习言习语”
网络安全与虚拟化技术,如何保障虚拟化环境下的网络安全?
热门
标签
更多标签
云服务器
即时通信 IM
ICP备案
对象存储
实时音视频
活动推荐
运营活动
广告
关闭
领券