腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
您
如何将
2D
矩阵
表示
为
输入
状态
,
并
让
它
选择
它
认为
对
该
状态
最好
的
操作
的
行
的
索引
?
我正在尝试构建一个RL模型,其中
输入
是一个NxM
矩阵
,N是可选动作
的
数量,M是描述动作
的
特征。到目前为止,在我所见过
的
所有RL问题中,
状态
空间要么是一个向量,然后传递给一个常规
的
神经网络,要么是一个图像,然后通过卷积神经网络传递进来。但是假设我们有一个环境,其中
的
目标是学习
为
固定任务
选择
最强大
的
工作者,单个
状态
表示
如下所示: names = ['Bob&
浏览 21
提问于2021-02-17
得票数 0
1
回答
Q-学习具有
状态
-动作-
状态
奖励结构和以
状态
为
行
,动作为列
的
q-
矩阵
。
、
、
我在R中建立了一个Q-学习问题,
并
希望
对
我
的
方法
的
理论正确性有所帮助。 对于这个问题
的
问题结构,环境由10个可能
的
状态
组成。在每种
状态
下,代理都有11个可能
的
操作
,可以从中
选择
(无论代理处于何种
状态
,这些
操作
都是相同
的
)。随着时间
的
推移,
它
得到
的
回报越来越少。我已经研究过其他潜在
的</
浏览 0
提问于2017-07-29
得票数 1
1
回答
读取
矩阵
Simulink机器人手臂
、
我正在建立机器人手臂
的
轨迹,并以
矩阵
格式计算了自由度
的
位置,即第一位置是
矩阵
(x1,y1,z1)
的
第1
行
,第二位置是第2
行
(x2,y2,z2)等等。我试图在Simulink中一次读取一
行
,并在到达第一个位置时更改为下一
行
。但是,我不可能用脚本来解决这个问题。有什么建议吗?
浏览 3
提问于2014-06-02
得票数 0
回答已采纳
5
回答
状态
机
表示
、
我希望将GUI实现为
状态
机。我
认为
这样做有好处也有缺点,但这不是这个问题
的
主题。在阅读了这方面的文章之后,我发现了几种在C++中
对
状态
机建模
的
方法,我坚持使用了2,但是我不知道哪种方法更适合于GUI建模。用以下方法将
状态
机
表示
为
状态
列表: - `OnEnterState(...);`从StateMachine::OnEvent将
浏览 12
提问于2012-12-07
得票数 3
回答已采纳
1
回答
如何制作一个基于参数生成|0>或|1>
的
门?
、
我想要做一个单量子位门,
它
给|0>或|1>参考一个参数。 Python 3.7.3
浏览 0
提问于2019-09-07
得票数 3
回答已采纳
2
回答
numpy.random.choice和random.choice
的
输入
参数有区别吗?
、
、
为什么numpy.random.choice和random.choice
的
工作方式不一样?当我这样做
的
时候: (1, 2) >>> np.random.choice([(1,2), (3,4)]) File "<stdin>"mtrand/mtrand.c:15450
浏览 0
提问于2017-04-28
得票数 6
回答已采纳
1
回答
Q学习教程困惑
、
我
对
任何机器学习方法都很陌生,我想我会尝试一下Q-学习。所以我一直在读这篇文章: Q(1, 5) = R(1, 5) + 0.8 * Max[Q(5, 1), Q(5, 4), Q(5, 5)] = 100 + 0.8 * 0 =R
矩阵
是静态
的
。
浏览 0
提问于2015-09-03
得票数 1
回答已采纳
1
回答
具有
状态
-动作-
状态
奖励结构和以
状态
为
行
、动作为列
的
Q
矩阵
的
Q学习
、
、
、
、
我已经在R中建立了一个Q学习问题,
并
希望在我构建问题
的
方法
的
理论正确性方面提供一些帮助。 Problem structure对于此问题,环境由10种可能
的
状态
组成。在每个
状态
下,代理都有11个可供
选择
的
潜在
操作
(这些
操作
与代理所处
的
状态
无关)。最大
的
问题是,在我
的
Q学习中,我
的
代理没有学习。随着时间
的
推移,<e
浏览 61
提问于2017-07-29
得票数 0
回答已采纳
1
回答
基于android
的
Loop the Loop(栅栏)益智游戏开发
、
它
基本上由n×m (n×m)个单元
矩阵
组成。每个单元格都有边和角(点)。规则很简单。你必须在这些点之间画一条线,以形成一个没有交叉点或分支
的
单圈。一个单元格
的
数字
表示
它
周围有多少
行
。为了开发可视化
的
n×m
矩阵
,我考虑使用n×m
行
的
网格布局。每个单元格将保留一个默认不透明度
为
0
的
按钮,即它是透明
的
。当用户单击一条边时,
它
的
浏览 1
提问于2012-10-28
得票数 1
回答已采纳
2
回答
测量门是如何工作
的
?
我有一个
状态
|Q>
的
n位,
并
希望测量位数i。是否有一个
矩阵
可以应用于
状态
,所以
状态
Q最终变成了Q',就像Hadamard或X门一样?或者我应该根据测量结果应用度量
矩阵
|x><x|,如果是0,那么是x=0,如果是1,则是x=1。
浏览 1
提问于2016-03-28
得票数 2
1
回答
可能
的
NxN
矩阵
,T1在每一
行
和每列,没有对角线?
、
、
示例 随附
的
是Lefty算法
的
演练,该算法计算nxn 0-1
矩阵
的
数目,在每一
行
和每列中有t
矩阵
,但在主对角线上没有。用于验证所给方程
的
算法
对
所有可能
的
矩阵
进行计数,但不构造它们。它被称为“左”,
它
相当简单,
最好
用一个例子来描述。假设我们想要计算6x60-1
矩阵
的
数目,每一
行
和每列有两个
矩阵
,但是主对角线上没有
浏览 2
提问于2016-01-16
得票数 2
1
回答
如何定义维度,以便在显示所有值时不忽略FK中
的
空值?
、
、
我使用Modrian
对
OLAP多维数据集进行建模,
并
使用Jaspersoft
表示
它
。多维数据集建立在一个包含FKs到维度表
的
事实表之上。目前,我
的
事实表拥有维度
的
可空外键,我个人
认为
这很有趣(据我所知,这只是造型决定是否使用可空
的
FKs ( ) )。问题是,当
选择
所有的
状态
(在我
的
设计中,state是维度)时,我只得到具有
状态
的
记录,而不是没有
浏览 4
提问于2015-08-19
得票数 1
回答已采纳
3
回答
计算DFA接受
的
字符串数
的
最优算法
、
、
这是我遇到
的
问题DFAs可以用
状态
图
表示
。数组A
表示
从
状态
编号I到
状态
Ai
的
0边缘,对于所有的0≤i≤K-1 数组B
表示
从
状态
编号i到
状态
Bi
的
1条边,用于所有0≤i≤K
浏览 4
提问于2015-10-10
得票数 6
回答已采纳
1
回答
JSF PrimeFaces inputText JSF
、
、
但是
它
总是传递dataTable
的
最后一
行
,而不是包含当前单击
的
p:inputText__
的
行
的
索引
。从我之前
的
问题中可以看出,我正在尝试使用p:inputText作为一个
状态
的
注释者,比如在Facebook或其他。实现包括一个p:dataTable。
它
的
行
表示
每种
状态
。,在第二个
状态
(<em
浏览 2
提问于2013-02-20
得票数 3
回答已采纳
1
回答
利用梯度梯度实现SARSA
、
、
本质上,我有一个Q值
矩阵
,其中每一
行
对应一个
状态
,每列对应一个动作。[Q(sn,a1), Q(sn,a2), Q(sn,a3), Q(sn,a4)]我
的
第一个假设是建立一个两层网络,
输入
层
的
输入
神经元和有
状态</e
浏览 2
提问于2015-04-30
得票数 1
回答已采纳
1
回答
多层感知器是否只能接受
输入
数据
的
一维矢量?若然,
为
甚麽会这样呢?
、
、
我正在阅读下面的教程,
它
使用MNIST手写数字数据库。machinelearningmastery.com/handwritten-digit-recognition-using-convolutional-neural-networks-python-keras/ 28x28大小
的
图像数据必须被重塑成一个784像素
的
一维矢量。为什么多层感知器只坚持
输入
数据
的
一维矢量?卷积神经网络和递归神经网络不存在接受高维
输入
形状
的
问题。
浏览 0
提问于2018-08-18
得票数 2
1
回答
如何构建基于环境
状态
在环境中
选择
正确对象
的
DQN?
、
、
、
我有一个有4个对象
的
环境。可以
选择
所有这些对象,也可以不
选择
。因此,我
的
DQN所采取
的
行动应该类似于- [1,0,1,1],[0,0,0,1],[1,1,0,0]...etc。其中1
表示
对象被选中,0
表示
对象未被选中。作为DQN
输入
的
环境
状态
由每个对象
的
属性和环境
的
其他因素组成。DQN将根据它所做
的
选择
获得奖励。我刚开始强化学习,我只构建了DQN
浏览 0
提问于2020-05-22
得票数 1
回答已采纳
3
回答
计算
矩阵
块
、
、
、
直观地说,n可以看作是
矩阵
的
“像素大小”。++oo++++oo++++++有块状2。虽然有些条目可以被
认为
属于较大
的
块,但2是
对
所有条目有效
的
最大块大小。即使任何条目都可以被视为属于某个大小
为
“滑动”
的
2块,也不可能使用
该
大小
的
相邻块来形成
浏览 0
提问于2021-11-08
得票数 19
回答已采纳
2
回答
马尔可夫决策过程
的
转移
矩阵
必须是随机
的
吗?
、
、
、
、
我正在尝试使用值迭代(通过pymdptoolbox)和NumPy
为
中指定
的
马尔可夫决策过程问题找到最优策略。但是pymdptoolbox说我
的
转换
矩阵
“不是随机
的
”。import mdptoolbox trans
浏览 4
提问于2017-04-28
得票数 1
2
回答
关于理解餐桌最佳座位算法
的
问题
、
、
我正在阅读一个问题,
并
试图解决这个问题。 你有一张圆形餐桌,你想
让
周围的人都坐下来。不幸
的
是,并不是所有的朋友都是朋友,但你想
让
每个人都坐到
最好
的
位置,这样尽可能多的人坐在他们
认为
是朋友而不是敌人的人旁边。你在一个大小
为
NxN
的
矩阵
中描绘了每个人
的
友谊和仇恨,用整数
表示
友谊,用-1
表示
仇恨,用0
表示
冷漠。,例
浏览 1
提问于2019-02-03
得票数 10
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
《Deep Learning with Python》第二章 2.2 神经网络的数据表示(1)
为纯 OpenWhisk 操作创建单元测试
线程状态详解
领取你的递归神经网络的入门教程!
人工神经网络・Softmax多分类
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券