腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(52)
视频
沙龙
1
回答
PyTorch
-
正确
计算
神经
正切
核
(
每个
数
据点
的
雅
可比
)
、
、
在
PyTorch
中,我有一个形状为(batch size, input dimension)
的
固定数据集x和一个前馈网络network。如果我调用shape (batch size, output dimension)
的
网络yhat = network(x)
的
输出,我如何
计算
yhat相对于
每个
数
据点
的
network参数
的
梯度?
浏览 30
提问于2020-07-10
得票数 0
1
回答
在
pytorch
中,和
的
梯度是否等于
神经
网络
的
梯度之和?
、
、
、
假设我有下面的代码,我想
计算
L
的
雅
可比
矩阵,这是由
Pytorch
中
的
神经
网络做出
的
预测,L
的
大小为nx1,其中n是小批量样本
的
数量。为了避免L (n个条目)
的
每个
条目的for循环来
计算
小批量中
每个
样本
的
雅
可比
,我发现一些代码只是将
神经
网络(L)
的
n个预测相对于输入求和,然后<
浏览 26
提问于2020-09-27
得票数 2
回答已采纳
1
回答
Pytorch
求和jacobian对输入而不是输出
、
、
、
假设我有一个张量Y,它是从张量X (直接或间接)
计算
出来
的
。这个掩码实际上是Y w.r.t
的
元素梯度
的
加权和。X。 是否有可能得到与Y mask[i][j] 相同形状
的
梯度掩模,其中
每个
元素是 Y[i][j] w.r.t. X**?**
的
梯度之和。这相当于将
雅
可比
J(Y,X)与X维
数
之和,而非Y维
数
之和。
计算
Y w.r.t X
的
雅
可比</
浏览 3
提问于2021-08-30
得票数 2
回答已采纳
2
回答
GradientTape在多重
雅
可比
计算
中
的
重复使用
、
、
、
、
我试图
计算
TensorFlow
神经
网络
的
输出相对于它
的
输入
的
雅
可比
。这很容易用tf.GradientTape.jacobian方法实现。对于一个非平凡
的
雅
可比
计算
(例如,对于具有非线性激活函数
的
深卷积
神经
网络),重复重新运行GradientTape
计算
和评估jacobian方法是非常昂贵
的
。我从中得知,梯度(因此也是
雅<
浏览 5
提问于2020-02-03
得票数 2
回答已采纳
3
回答
什么是反向传播?
我有一个概念上
的
问题,因为术语困扰着我。反向传播算法是一种
神经
网络训练算法,还是仅仅是一种递归算法来
计算
神经
网络
的
雅
可比
?那么这个Jacobian将作为主要训练算法
的
一部分,例如最陡峭
的
下降?因此,
计算
雅
可比
矩阵(
神经
网络输出到网络参数
的
偏导数)是一种训练算法还是一种数值方法?
浏览 0
提问于2021-09-08
得票数 4
回答已采纳
1
回答
神经
网络交叉验证:如何处理历元
数
?
、
、
、
我正在实现一个
pytorch
神经
网络(回归),并希望确定最佳
的
网络拓扑结构、优化器等。我使用交叉验证,因为我有x个测量数据库,我想评估我是否能够用x数据库
的
子集来训练一个
神经
网络,并将
神经
网络应用到看不见
的
数据库中。因此,我还介绍了一个测试数据库,它不用于超参数识别阶段。对于如何处理交叉验证中
的
历元
数
,我感到困惑,例如,我有许多历元= 100。有两种选择: 划时代数是一个需要调整
的
超参数。在
每个
时代
浏览 1
提问于2020-04-29
得票数 1
回答已采纳
1
回答
用参数分担法
计算
卷积
神经
网络中
的
权值
、
在阅读迈克·奥尼尔( Mike‘’Neill)
的
一本书“和”时,我遇到了一些关于卷积
神经
网络中权重数
的
计算
,这是我想要理解
的
。
每个
特征映射为5x5,特征映射中
的
每个
单元都是前层所有6个特征映射
的
对应区域
的
5x5卷积
核
,
每个
特征映射都是13x13特征映射。权重
的
计算
,(5x5+1)x6x50 = 7800,对我来说似乎很奇怪。不应该是这样
的
浏览 0
提问于2019-02-14
得票数 0
1
回答
神经
网络训练中梯度和偏导数
的
解释
、
、
、
、
我试图通过了解如何解释梯度及其偏导数来理解
神经
网络训练中偏微分
的
目的。下面是我解释它们
的
方法,所以我想知道我是否
正确
,如果不是,是否有人能指出我
的
正确
方向。如果我们处理
的
函数依赖于几个变量,那么这个函数对所有这些因变量
的
导数就是一个梯度(即偏导数
的
向量),它指向函数极值
的
方向。
每个
偏导数对应于我们试图优化
的
N维空间中
的
一个特定维
数
(例如二次代价函
浏览 0
提问于2020-01-17
得票数 3
回答已采纳
2
回答
卷积
神经
网络(CNN)反向传播中
的
误差δ是如何传播
的
?
、
、
我
的
CNN有以下结构:输入矩阵(I):28x28最大池层(MP):大小为2x2 (输出维
数
为3x12x12)在向前传递之后,我将输出层中
的
误差增量
计算
为: \delta^L = (a^L-y) \odot \sigma我用以下方法
计算
下一层
的
误差增量:
浏览 0
提问于2020-06-06
得票数 4
1
回答
Pytorch
中
神经
网络
的
前向
雅
可比
很慢
、
、
我在
pytorch
中
计算
一个2层前馈
神经
网络
的
前向jacobian (输出相对于输入
的
导数),我
的
结果是
正确
的
,但相对较慢。考虑到
计算
的
性质,我预计它
的
速度大约与通过网络
的
前向传递一样快(或者可能是2-3倍长),但是在这个例程上运行优化步骤(在我
的
测试示例中,我只需要所有点
的
jacobian=1 )与标准均方误差相比,需要大约我只是想知道有没有人
浏览 18
提问于2019-01-27
得票数 2
回答已采纳
2
回答
1对rest分类器
、
、
我正在实现一个one-versus-rest分类器,以区分对应于(1)移动
计算
机光标向上
的
神经
数据和(2)在其他七个主要方向上移动它或不移动
的
神经
数据。我使用了一个带有RBF
核
的
SVM分类器(由LIBSVM创建),我做了一个网格搜索来为我
的
分类器找到最佳
的
伽马和代价参数。不幸
的
是,我
的
结果不是很好,而且,我找不到一个解释
的
原因。我测试了37759个数
据点
,其中16
浏览 2
提问于2011-07-28
得票数 0
1
回答
如何从
核
密度估计中得到一个函数?
、
我将给出我目前执行KDE
的
一些伪码,以便更好地向您展示我
的
问题。(我复制了维基百科
的
例子:) 确保所有点
的
概率之和达到100%,并根据这些点
的
概率抽取样本。这是可行
浏览 0
提问于2019-09-02
得票数 0
回答已采纳
7
回答
支持向量机与
神经
网络
、
、
、
支持向量机和
神经
网络有什么区别?线性支持向量机是否真的是相同
的
神经
网络,对于非线性可分离问题,
神经
网络使用添加隐藏层,支持向量机使用变化
的
空间维度?
浏览 3
提问于2012-01-23
得票数 35
回答已采纳
2
回答
基于有限特征
的
预测准确率
、
、
、
、
基于命令后是否完成和使用什么accuracy/probability完成
的
实践问题具有以下特性:Placed Time float64int32Response Delay float64我
的
方法是使用看上去是这样
的
: tf.k
浏览 4
提问于2019-11-29
得票数 0
回答已采纳
4
回答
了解角化角中conv2d层
的
输出形状
、
、
我不明白为什么渠道维度不包括在Keras中
的
conv2D层
的
输出维度中。Model(input=image, output=output)model.summary() 模型摘要给出了我问题末尾
的
数字输入层采用宽度= 128和高度= 128
的
RGB图像。第一个conv2D层告诉我输出维度是(None,61,61,24)。我使用了内核大小(8,8),这是(2,2)没有填充
的
一大步。61 =楼层((128-8+2* 0)
浏览 5
提问于2019-03-31
得票数 13
4
回答
毕道尔,梯度参数是什么?
、
、
、
、
我正在阅读
PyTorch
的
文档,并找到了一个他们编写y.backward(gradients) print问题是,梯度张量
的
0.1,1.0和0.0001参数是什么?这方面的文件并不十分清楚。
浏览 6
提问于2017-04-17
得票数 134
回答已采纳
1
回答
不规则时间序列分类
我试着把病人入院
的
时间序列分为两组。它包括大量
的
空隙(月或年),然后是短时间内大量
的
数
据点
,承认。
每个
数
据点
由一个代码( 6000码中
的
一个)或一个代码和一个数值组成。并不是
每个
时间序列都包含所有代码,而且代码非常稀疏。我试图查看
每个
代码中值
的
分布情况,但一无所获。我尝试过一种朴素
的
Baysian方法,在忽略任何相关
的
值之后,研究每组代码
的
概率,并且做得更好一些。
浏览 0
提问于2018-10-30
得票数 1
1
回答
计算
图与
计算
机代数符号表达式
、
、
、
、
然后上面写着: AD可以被认为是对
计算
机程序
的
非标准解释,其中这种解释涉及到用各种导数
的
计算
来增强标准
计算
。 然后描述如何用AD (正向或后向模式)
计算
导数。该描述基本上是对评估跟踪/
计算
图
的
转换
浏览 1
提问于2019-04-26
得票数 4
回答已采纳
1
回答
如何
计算
火花作业中核心、执行器、内存
的
编号
、
谁能帮我找到火花中
的
核心、执行器、内存..etc
的
编号吗?Total 6 nodes(1 master and 5 slaves). 16 vCPUS per node 注-似乎主节点没有参与
计算
,这就是集群设置
的
方式
浏览 1
提问于2019-02-07
得票数 0
1
回答
计算
矩阵序列中
的
成对距离
、
我正在建立一个递归
神经
网络,其中我有一个时间序列
的
特征向量(N X D),其中N列中
的
每一列都对应于一个“事件”。我得到了事件坐标在另一个N×3矩阵中
的
演变。因此,如果我有一个长度为t
的
时间序列,那么随着单个“事件”
的
特征和坐标的演变,我正在处理维度为t x N x D和t x N x 3
的
输入。对于单事件分类
的
情况,我已经建立了一种方法来构造N个事件坐标的密集邻接矩阵。这涉及到
计算
N个坐标中
每个
坐标的成对距离并应用
浏览 32
提问于2019-05-11
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
卷积神经网络(CNN)的变革力量:解开图像识别的秘密
LeNet5-LeCun et.al
1万+字原创读书笔记,机器学习的知识点全在这篇文章里了
Pytorch 学习引发的思考
LossVal:一种集成于损失函数的高效数据价值评估方法
热门
标签
更多标签
云服务器
ICP备案
腾讯会议
云直播
对象存储
活动推荐
运营活动
广告
关闭
领券