腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
时间
反向
传播
,
对
初学者
的
简单
解释
、
、
、
我是一个全新
的
机器学习新手,我理解
反向
传播
和递归神经网络
的
概念,但我似乎无法掌握
时间
的
反向
传播
。identical所以据我所知,我们在当前步骤有了期望
的
输出,我们向前传递前面的步骤,计算上一步输出和当前输出之间
的
误差。谁能
简单</
浏览 12
提问于2016-08-02
得票数 1
2
回答
tensorflow如何使用
反向
传播
来训练模型?
、
、
我是tensorflow
的
初学者
,我想实现MLP并基于
反向
传播
算法
对
其进行训练,但当我阅读教程时,我发现它使用了像“随机梯度下降”这样
的
优化器,并在没有实现算法阶段
的
情况下调用了
反向
传播
。这是如何
反向
传播
的
?
浏览 8
提问于2016-12-15
得票数 1
1
回答
反向
传播
-最
简单
的
解释
、
、
你能用最
简单
的
方式
解释
一下背靠背
的
算法(数学方程)吗? 我读过很多关于它
的
文章,所以我知道它是什么,并理解它背后
的
直觉,但我仍然不理解“升级/改变”神经元
的
分层属性
的
方程式。
浏览 0
提问于2018-08-09
得票数 1
1
回答
在Keras中
的
反向
传播
?
、
、
、
谁能告诉我在Keras中
反向
传播
是怎么做
的
?我读到在Torch中很
简单
,在Caffe中很复杂,但我找不到任何关于使用Keras做这件事
的
东西。我正在用Keras (一个非常
初学者
)实现我自己
的
层,我想知道如何做
反向
传播
。 提前谢谢你
浏览 5
提问于2017-11-21
得票数 21
回答已采纳
1
回答
如何应用Keras
的
单层前馈或多层前馈模型
的
前向
传播
?
、
、
、
、
我想知道是否可以通过使用Keras中
的
前向
传播
来预测某些特性来实现
时间
序列数据上
的
single-layer-feed-forward和multi-layer-feed-forward模型?因为Keras隐式地执行
反向
传播
,不需要特殊
的
命令。如您所知,单层前馈和多层前馈模型被认为是前馈方法,据我所知,仅通过optimizer在
反向
传播
中使用model.compile(optimizer='adam'),它们将允许我们
浏览 3
提问于2019-05-11
得票数 0
1
回答
卷积神经网络
的
反向
传播
、
、
、
、
我已经看过很多关于这个主题
的
文章,基于Jefkine
的
卷积神经网络
的
反向
传播
似乎是最好
的
。尽管,正如作者所说,📷📷 我想出了如何用步幅、深度和更多
的
滤波器来
浏览 0
提问于2018-07-21
得票数 2
1
回答
实现ANN
的
python代码中
的
可变可见性/作用域
、
我正在用一个1
的
示例代码自我实现一个人工神经网络( ANN )。虽然原则上我清楚ANN代码是如何工作
的
(我以前用过其他语言),但我
对
python语法/逻辑有更多
的
问题:在第181行中,网络被训练了10000次,但是由于“
反向
传播
”(第39行)函数不返回网络,而变量“另外,在函数“
反向
传播
”中,变量"network“没有更新,但我猜这是因为运行中
的
变量,如"output_neuron”(第48行)是引用<e
浏览 0
提问于2018-05-24
得票数 0
回答已采纳
3
回答
用神经网络逼近正弦函数
、
我实现了一个
简单
的
神经网络框架,它只支持多层感知器和
简单
的
反向
传播
。它适用于线性分类和通常
的
异或问题,但对于正弦函数近似,其结果并不令人满意。我查看了作为参考,但即便如此,我仍然无法使它与
简单
的
反向
传播
(通过切换到弹性
传播
,它开始变得更好,但仍然比超级光滑
的
R脚本提供
的
更糟)。所以我真的想做一些不可能
的
事吗?不可能用
简单
浏览 5
提问于2012-12-15
得票数 24
4
回答
具有RELU
的
神经网络
反向
传播
、
输入层-> 1隐藏层-> relu ->输出层-> softmax层 上面是我
的
神经网络
的
架构。我
对
这个relu
的
反向
传播
感到困惑。对于RELU
的
导数,如果x <= 0,则输出为0。有人能
解释
一下我
的
神经网络架构“一步一步”
的
反向
传播
吗?
浏览 126
提问于2015-09-13
得票数 31
1
回答
在火炬中截断
时间
的
反向
传播
(BPTT)
、
、
在pytorch中,我训练RNN/GRU/LSTM网络,方法是启动
反向
传播
(通过
时间
):当序列很长时,我希望通过
时间
进行截断
的
反向
传播
,而不是使用整个序列
的
时间
进行正常
的
反向
传播
但是,我在Pytorch中找不到任何参数或函数来设置截断
的
BPTT。我错过了吗?我应该自己在毕道尔编码吗?
浏览 3
提问于2018-12-24
得票数 6
1
回答
如何利用导数来理解
反向
传播
、
、
现在,我
对
反向
传播
算法有一个问题。我知道使用链规则
的
多层神经网络中误差最小化
的
思想。然而,我不明白乙状结肠函数
的
导数
的
作用。该算法描述了这种导数。这有什么意义?你能用
简单
的
语言一步一步地
解释
这一点吗? 📷
浏览 0
提问于2018-05-16
得票数 0
回答已采纳
2
回答
如何实现tensorflow
的
反向
传播
?(记忆问题)
、
、
当我学习
的
时候,如果我试图向后
传播
到所有的层,我就会有内存问题。不过,测试效果很好。(我有一个Gforce GTX 1060和6G
的
拉姆) 我在想怎么回事?TF是否需要为训练两次保存参数?
浏览 2
提问于2017-05-18
得票数 0
回答已采纳
1
回答
凯拉斯模型在每一个时代都能学到什么?
、
、
我知道时代、批次大小和迭代
的
概念。比方说,Batch_size = 64在这个过程中,我们基本上是把64个数据点输入到计算机内存和计算中,在每次迭代时我们都会得到权值
的
更新。我
的
问题是,经过一个时代,我们再次使用相同
的
6400数据。在学习方面,它与第一个时代有何不同?模型是否选择了与第二个时代不同
的
64个数据点,并尝试学习?它内部是如何工作
的
呢?我希望我能得到一些明确
的
答案。 提前谢谢各位。
浏览 0
提问于2019-11-15
得票数 1
2
回答
向前传与后传对
反向
传播
、
、
正如问题中提到
的
,我有一些问题,了解这些术语之间
的
区别是什么。据我所知:2)
反向
传递:计算输出与期望输出相关
的
误差,然后返回到网络中,利用梯度下降ecc更新权值。 那么什么是
反向
传播
呢?这是前两个步骤
的
结合吗?或者是我们用来计算dE/dw
的
che方法?(链规则ecc.)
浏览 0
提问于2020-01-13
得票数 3
回答已采纳
1
回答
麦克斯普尔和雷鲁
的
反向
传播
、
为什么需要通过Why池和relu进行
反向
传播
?
反向
传播
的
目的是更新权值,而and池和relu则只对输入执行
简单
的
操作。他们没有真正
的
重量或过滤器。那么,为什么需要通过它们进行
反向
传播
呢?
浏览 0
提问于2018-08-11
得票数 1
1
回答
Tensorflow中
的
LSTM
反向
传播
、
在扇区截断
反向
传播
的
PTB google官方教程中,有一个使用BasicLSTMCell
的
实现,它通过创建一个for循环来展开num_steps步骤
的
图形。final_state = state 我已经使用BasicLSTMCell实现了一个预测
时间
序列
的
方法,因为我没有在图中使用任何循环,但我在程序执行循环中更新了lstmCells
的
状态。feed_dict={input_layer: input_v, correct_output: output_
浏览 14
提问于2016-07-29
得票数 1
回答已采纳
1
回答
RNN:只有在最后一步才能输出
的
时间
反向
传播
。
、
、
、
在这篇关于递归神经网络
的
中,Denny Britz著。 作者说:“上面的图表在每个
时间
步骤上都有输出,但根据任务
的
不同,这可能是不必要
的
。例如,在预测句子
的
情感时,我们可能只关心最后
的
输出,而不是每个单词之后
的
情感。同样,我们可能在每个
时间
步骤都不需要输入。”在这种情况下,当我们只在最后一步获得输出:
反向
传播
将如何改变,如果在每个
时间
步骤没有输出,只有最后一个?我们需要在每个
时间
浏览 5
提问于2017-03-10
得票数 0
回答已采纳
1
回答
为什么使用retain_graph=True不会导致错误?
、
、
、
如果我需要通过神经网络
反向
传播
两次,并且我没有使用retain_graph=True,我会得到一个错误。 为什么?我意识到保持用于第一个
反向
传播
的
中间变量在第二个
反向
传播
中重用是很好
的
。然而,为什么不
简单
地重新计算它们,就像最初在第一次
反向
传播
中计算它们一样?
浏览 0
提问于2019-08-11
得票数 0
1
回答
神经网络
的
训练
时间
包括什么?
、
我最近开发了一个DNN模型,我想知道训练
时间
到底是什么,其中包括了哪些步骤?对于ex,我执行了以下步骤: 1)通过5倍
的
CV (使用
反向
传播
)确定最佳网络体系结构;2)获得最佳体系结构后,使用无监督学习获得初始权重,使用无标签数据;3)应用
反向
传播
,根据步骤2
的
初始权重
对
网络进行微调(运行500次) 这个过程
的
训练
时间
是多少?或者一般来说,培训
时间
包括运行最佳体系结构代码
的
浏览 0
提问于2018-03-22
得票数 2
1
回答
是否有数学验证
的
TBPTT (截断
反向
传播
时间
)
、
、
我
的
问题在标题里。我目前正在寻找关于该算法
的
论文或学术参考,即使是在一个新
的
框架中。 谢谢你所有可能
的
答复
浏览 0
提问于2018-05-18
得票数 1
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
简单函数解释python中的时间转换
知识卡片 反向传播中的梯度
人工智能系列(七)深度学习中的梯度下降与反向传播
80页机器学习笔记,帮你少走弯路!
深度学习与神经科学相遇(二)译
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券