腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
2
回答
在
TensorFlow2
中
使用
学习
率
计划
和
学习
率
预热
、
、
我必须
使用
学习
率
预热
,您可以
使用
学习
率
预热
开始训练CIFAR-10的VGG-19 CNN,在前10000次迭代(或大约13个时期)
中
从0.00001到0.1%的
学习
率
。然后对于剩余的训练,您
使用
学习
率
0.01,其中
学习
率
衰减用于
在
80
和
120个时期将
学习
<e
浏览 62
提问于2020-08-02
得票数 3
2
回答
Keras回调:
学习
率
、
计划
率
和
高原
学习
率
的降低
、
、
我试图
在
Keras
中
同时
使用
LearningRateScheduler
和
ReduceLROnPlateau回调,这会给
学习
速度带来问题吗?如果是这样的话,该模型
使用
的
学习
率
是多少?我
在
尝试时遇到了这个问题,这影响了我的模型的准确性。就像在这里
在
我的acc: 0.8778 -> 0.8188的情况下。 你认为那个时候的
学习
率
是多少?
浏览 3
提问于2018-12-03
得票数 1
回答已采纳
3
回答
如何在N个时期后调整
学习
率
?
、
、
、
如何在N个时期后调整
学习
率
?例如,我将初始
学习
率
设置为lr=2e-6,并且我希望
在
第一个时期之后将
学习
率
更改为lr=1e-6,并在剩余的训练中保持该
学习
率
。last_epoch=-1我知道有,但在这里,它每个时代都会降低
学习
率
我希望它在1个时期后下降,然后
在
剩下的训练过程中保持不变。
浏览 5
提问于2021-07-23
得票数 1
1
回答
神经网络,是否值得随着时间的推移改变
学习
率
和
动量
、
在
满足某些条件后,是否值得更改
学习
率
?以及如何
和
为什么要这样做?例如,网络将从高
学习
率
开始,当平方误差足够低时,
学习
率
将下降以获得更高的精度,或者
学习
率
应增加到跳出局部最小值?这不会导致过度拟合吗?
浏览 0
提问于2013-04-13
得票数 6
回答已采纳
1
回答
为什么VGG-16
在
CIFAR-10数据集上表现不佳?
、
、
、
、
我正在尝试
使用
Tensorflow为CIFAR-10数据集实现VGG-16卷积神经网络。但我的训练准确
率
接近10%。我的代码出了什么问题?
浏览 117
提问于2021-07-10
得票数 0
1
回答
在
不
使用
回调的情况下为Adam设置自适应
学习
率
、
、
、
在
TF2.0
中
,优化器被定义为在这种情况下,如何设置
学习
率
?它只是像下面这样初始化参数吗?如何设置自适应
学习
率
?tf.keras.optimizers.Adam(learning_rate=0.001)model.fit
浏览 2
提问于2019-09-20
得票数 1
1
回答
LSTM训练模式
、
、
、
、
可以训练逻辑以达到100%的准确
率
。我运行了许多测试,我发现最有效的模型是3个LSTM层,每个层都有15个隐藏单元。这在22个时期之后返回了100%的准确
率
。然而,我注意到了一些我很难理解的事情:在前12个时期,模型
在
精度(acc.保持0.5),并且只有边际进展(从0.69到0.65)由绝对的Crossentropy衡量。
浏览 7
提问于2017-04-17
得票数 4
1
回答
学习
率
将wrt衰减为累积奖励?
、
在
深度强化
学习
中
,有没有办法将
学习
率
wrt衰减为累积奖励?我的意思是,当智能体能够
学习
并最大化奖励时,衰减
学习
率
?
浏览 18
提问于2020-06-18
得票数 0
1
回答
Keras优化器
中
的衰减参数
、
、
、
我目前正在用Keras训练CNN,我正在
使用
Adam优化器。我的
计划
是
在
每一个时代之后逐渐降低
学习
率
。我以为衰变参数就是为了这个。
学习
速率
在
每次更新中都会衰减。 然而,当观察张紧板中
使用
的
学习
率
时,它与初始
学习
率
保持不变。那么,这个衰变参数是如何工作的呢?
浏览 0
提问于2017-12-29
得票数 7
4
回答
需要好的方法来选择
和
调整“
学习
率
”
、
、
在下图中,您可以看到一个
学习
算法,它试图
学习
生成所需的输出(红线)。该
学习
算法类似于反向误差传播神经网络。 “
学习
率
”是一个值,它控制
在
训练过程中所做的调整的大小。如果
学习
率
太高,则算法
学习
速度很快,但其预测
在
训练过程中会跳跃很多(绿线
学习
率
为0.001),如果
学习
率
较低,则预测跳跃较少,但算法需要更长的
学习
时间(蓝线
学
浏览 1
提问于2009-06-05
得票数 11
回答已采纳
2
回答
为什么Adam优化器的Keras实现有decay参数,而Tensorflow没有?
、
、
、
为什么Adam优化器的Keras实现有decay参数,而Tensorflow没有?这个说法是什么意思呢?
浏览 2
提问于2018-11-01
得票数 0
2
回答
PyTorch:如何在任何给定时刻更改优化器的
学习
率
(无LR
计划
)
、
、
、
、
在
PyTorch
中
,是否可以
在
训练过程
中
动态更改优化器的
学习
率
(我不想预先定义
学习
率
计划
)?假设我有一个优化器:现在,由于我
在
训练期间进行了一些测试,我意识到我的
学习
率
太高了,所以我想将其更改为
浏览 4
提问于2018-01-18
得票数 62
回答已采纳
1
回答
如何确定神经网络训练过程
中
的
学习
率
?
、
、
、
例如,如果我想
使用
手动
学习
率
,初始
学习
率
为0.01,10000步后衰减
学习
率
为0.001,20000步后衰减
学习
率
为0.0001。 我如何才能知道这些我需要衰减
学习
率
的步骤?有什么经验可以指导我吗?我们通常可以
在
论文中找到这些步骤,但作者是如何获得这些步骤的?
浏览 11
提问于2017-12-08
得票数 0
2
回答
一旦损失停止减少,就改变Keras
中
的
学习
率
、
、
、
、
我是深度
学习
的新手。我构建了一个小型架构,并
使用
Adam优化器对其进行编译,如下所示:#Train
浏览 0
提问于2020-09-03
得票数 0
1
回答
MDP与强化
学习
& VI、PI
和
QLearning算法的收敛性比较
、
、
、
、
我
使用
python实现了VI (值迭代)、PI (策略迭代)
和
QLearning算法。
在
比较了结果之后,我注意到了一些事情。VI算法
和
PI算法收敛于相同的实用程序
和
策略。我读了很多关于MDP
和
RL的论文和书籍,但是找不到任何东西来说明VI-PI算法的实用程序是否应该收敛到与QLearning相同的实用程序。 VI<
浏览 3
提问于2017-12-28
得票数 1
回答已采纳
1
回答
如何正确地建立神经网络训练以保证稳定的精度
和
损失
、
、
、
、
剩下的数据,我分成培训
和
测试。所有的数据集都没有重叠!每100批
使用
验证数据加载器评估损失。
在
一个时代结束时,将当前状态
在
验证数据上的损失与以前具有最佳验证损失的状态进行比较(对于第一个阶段,只需将其与1e5这样的随机高数进行比较),并保存当前状态,如果它更好,或者保持旧状态。我想知道如何扩展我的设置,使它成为一个适当的统计实验设置,目的是获得稳定的准确性
和
损失的结果(我想说,我的模型提供了一致的结果。我在想,沿着运行测试步骤的思路,比如说1
浏览 0
提问于2021-01-30
得票数 1
回答已采纳
2
回答
咖啡因的损失不会减少
、
、
、
我注意到,
在
680次迭代之后,损失并没有改变。我想这可能是因为我
在
像素上应用了1/255的比例,但我已经删除了它,没有任何变化。我的数据
在
LMDB
中
(1lmdb用于训练图像,1lmdb用于训练标签,1用于验证,1用于验证标签),标签是0
和
1存储为uint8。 有人有什么建议吗?
浏览 4
提问于2017-09-01
得票数 0
2
回答
如何在Python
和
Numpy
中
解决这个简单的线性回归产生的错误?
、
、
、
、
因此,我正在尝试仅
使用
python
和
numpy创建一个简单的线性回归神经网络。我已经解决了大多数原始问题,除了网络的误差只会增加之外,它工作得很好。
浏览 24
提问于2020-07-28
得票数 0
1
回答
实现梯度下降爆炸到无穷大?
、
为什么它不能在我的代码
中
工作?
浏览 24
提问于2021-07-13
得票数 0
1
回答
快速R论文中“每层
学习
率
”的含义是什么?
、
、
在
“SGD超参数”的2.3部分
中
,所有层都
使用
每层
学习
速率1作为权重,2用于偏倚,全局
学习
速率为0.001。“每层
学习
速率”与“分层特定
学习
率
”是一种分层
学习
速度吗?如果是这样的话,我无法理解它们(“每层
学习
速率”
和
“全球
学习
速率”)是如何同时应用的?我发现了“特定层的
学习
速率”的例子。
浏览 2
提问于2021-10-01
得票数 2
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
杭州UI设计学习|如何增加点击率和转化率
SafePredict:使用拒绝机制保证正确率的机器学习元算法
16个GitHub收藏和贡献率最高的深度学习框架
Nature|基于深度学习和高分辨率卫星的树木监测研究
从NLP终生学习开始,谈谈深度学习中记忆结构的设计和使用
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券