腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
加载
先前
训练
的
模型
时
出现
奇怪
的
损失
波动
python
、
deep-learning
、
pytorch
、
loss
我之前
训练
了一个
模型
,并保存了参数。
训练
结束前
的
损失
值约为0.003~0.006。 然而,当我用相同
的
训练
数据
加载
相同
的
模型
时
,
损失
值一开始会
波动
到0.5左右。然后,
损失
值在~10次迭代中非常迅速地减少到0.01左右,现在缓慢下降。 有人知道为什么会发生这种情况吗?因为我正在
加载
相同
的
模型
浏览 45
提问于2019-02-21
得票数 1
1
回答
验证
损失
在
训练
损失
中不断
波动
。
deep-learning
、
keras
、
loss-function
、
convergence
我正在
训练
一个用于多目标回归
的
Keras
模型
,使用一个自定义
的
损失
函数,目的是使该
损失
函数
的
预测精度低于0.01。从
损失
函数
的
下面图可以看出,
训练
损失
和验证
损失
迅速低于目标值,
训练
损失
趋近较快,验证
损失
在
训练
损失
值上不断
波动
。虽然
损失
低于目标阈值,但我想知道
浏览 0
提问于2018-08-06
得票数 1
1
回答
在多标签图像分类任务中,哪个
损失
函数会收敛得更好?
tensorflow
、
keras
、
deep-learning
、
computer-vision
、
conv-neural-network
我使用sigmoid作为输出激活函数,binary_crossentropy作为
损失
函数,
训练
了一个多标签多类图像分类器。验证
的
精度曲线显示上下
波动
,而少数时期
的
损失
曲线显示
奇怪
(非常高)
的
值。以下是使用Dropout和BatchNormalization微调(最后一个块) VGG19
模型
的
精度和
损失
曲线。使用Dropout、BatchNormalization和Data Augmentation微
浏览 1
提问于2020-02-10
得票数 0
1
回答
角膜缘中fit与评价
的
差异
tensorflow
、
keras
、
deep-learning
、
batch-normalization
我用100000个样本在Keras中
训练
了一个通用
模型
,并取得了良好
的
性能。然后,对于特定样本,我希望使用
训练
的
权重作为初始化,并继续优化权重,以进一步优化特定样本
的
损失
。 然而,
出现
了这个问题。首先,我通过keras轻松地
加载
训练
过
的
权重,然后对一个特定样本
的
损失
进行评估,该
损失
与
模型
训练
过程中验证
损
浏览 0
提问于2018-12-23
得票数 0
2
回答
为什么在
训练
tensorflow对象检测ssd移动网络
模型
时
我
的
训练
损失
很高
tensorflow
、
object-detection-api
、
mobilenet
我正在尝试使用tensorflow api
模型
ssd移动网络创建自己
的
自定义对象检测器,但问题是,当
模型
开始
训练
时
,
损失
非常高,比如700-800,并且
损失
一直在
波动
,我看到相同
的
损失
值在重复,有人能给我解释一下吗我最初
训练
了7000步
的
模型
,但
损失
并没有减少,然后我又开始
训练
模型
。我正在分享我新
训练<
浏览 48
提问于2020-08-23
得票数 1
1
回答
恒定
的
验证
损失
和准确性,
训练
精度
波动
。
training
、
loss-function
、
learning-rate
、
deep-learning
我正在
训练
一个压缩网
模型
,用于图像
的
二值分类。我有79968张用于
训练
的
图像(50:50赞成和反对)和8892张图像在验证集中。经过35000次迭代后,我
的
训练
精度在1到0.96875之间
波动
。验证精度在0.986之间或多或少是恒定
的
。基础学习率为0.0 1,下降到0.00001.据我所知,视觉
训练
的
损失
并没有在这两个数字之间
波动
,但在大多数情况下都在0.02,0
浏览 0
提问于2018-09-10
得票数 2
1
回答
我
的
模特是不是太合适了?验证
损失
不断
波动
。
machine-learning
、
neural-network
、
deep-learning
我
训练
了一个四层神经网络n_cols = X_train.shape[1])当我绘制火车和验证
损失
之间
的
图表
时
,这个图看起来就像验证
损失
是
波动
的
。
浏览 0
提问于2019-08-20
得票数 1
回答已采纳
1
回答
tensorflow打印
的
损失
是批量/样本
损失
还是运行平均
损失
?
tensorflow
、
machine-learning
、
keras
、
loss-function
当我
训练
tensorflow
模型
时
,它通常会在每次迭代中输出类似于下面一行
的
信息 INFO:tensorflow:loss = 1.9433185, step = 11 (0.300 sec) 打印
的
损失
是
模型
当前看到
的
批次
的
损失
,还是所有
先前
训练
批次
的
运行平均
损失
?如果我使用批次大小为1
的
批次,即每批只有一个
训练</e
浏览 57
提问于2021-08-23
得票数 1
1
回答
极随机验证
损失
/准确性
keras
、
tensorflow
、
image-segmentation
📷在上面的图表中,橙色是
训练
的
表现,蓝色是验证。验证精度和
损失
值比
训练
精度和
损失
大得多。即使
训练
正确率在90%左右,验证精度在某一
时
间点甚至达到0.2%。为什么验证指标
波动
得很厉害,而
训练
指标却保持相当恒定?我用U网
模型
将卫星图像分割成三个土地覆盖类别。在20k
训练
实例中,大约8200个包含1级像素。 当向
浏览 0
提问于2020-08-31
得票数 1
3
回答
LSTM
训练
过程中角点
的
验证
损失
与LSTM稳定性
keras
、
lstm
、
activation-function
我现在使用Keras来
训练
我
的
LSTM
模型
来解决时间序列问题。我
的
激活函数是线性
的
,优化器是Rmsprop。然而,我观察到
的
趋势是,当
训练
损失
缓慢减少时,在一个较小
的
值附近
波动
,验证
损失
在很大
的
方差上上下跳跃。 因此,我提出了两个问题: 1.验证性
损失
是否影响培训过程?2.如何使
模型
更稳定,从而使
模型
返回一个更稳定
的</
浏览 6
提问于2017-08-21
得票数 0
1
回答
列车
损失
与验证
损失
machine-learning
、
cross-validation
、
training
、
loss-function
、
mini-batch-gradient-descent
我有几个基本
的
问题,关于跟踪
损失
在
训练
。停止
训练
以防止过度
训练
的
条件是什么?你在那个时候保存
模型
了吗?如果我使用小批量
训练
损失
波动
很大,取决于随机选择
的
训练
数据,有时验证
损失
小于
训练
损失
。这是正常
的
吗?我想我对这一点
浏览 0
提问于2018-04-26
得票数 5
1
回答
如果给出验证数据,Keras如何选择最终
模型
?
validation
、
machine-learning
、
keras
、
deep-learning
最后
的
训练
步骤可能没有最低
的
损失
,如果
损失
波动
。有吗?通过从整个培训过程中选择对验证数据
损失
最小
的
模型
来选择Keras Keras从最终
的
培训步骤中选择最终
模型
,而不管最终
模型
是否给出验证数据
的</em
浏览 3
提问于2020-12-18
得票数 2
回答已采纳
1
回答
用综合数据评价蒙皮RCNN
训练
进度
的
地图曲线
machine-learning
、
computer-vision
、
object-detection
在
训练
的
不同阶段,MAP (平均平均精度)是否能很好地替代
训练
和验证精度,是用于目标检测
的
机器学习
模型
?我正在重新
训练
Mask RCNN (预科MS)
的
合成图像(有五个课程),验证
损失
似乎上下
波动
,直到1600年代,尽管
训练
损失
下降。我计算了每100年代
的
平均精度,无论是
训练
数据还是验证数据,我都不知道该怎么做。 📷
浏览 0
提问于2019-12-18
得票数 2
1
回答
为什么我
的
损失
和准确率图有点不稳定?
python
、
tensorflow
、
keras
我构建了一个Bi-LSTM
模型
,它试图根据给定
的
单词预测特定
的
类别。例如,“微笑”这个词应该由“友好”来预测。然而,经过
训练
后,该
模型
每10个类别(总共1000个)有100个样本,在绘制准确性和
损失
时,这两种情况略有不稳定。为什么会发生这种情况?增加采样数会导致拟合不足。
模型
def build_model(vocab_size, embedding_dim=64, input_length=30): print('\nbuilding the mod
浏览 78
提问于2020-10-18
得票数 1
回答已采纳
1
回答
如何从预先
训练
的
模型
中获得Gensim中
的
word2vec
训练
损失
?
gensim
、
word2vec
我有一些预先
训练
好
的
word2vec
模型
,我想用相同
的
语料库对它们进行评估。在给定
模型
转储文件和内存中
的
语料库
的
情况下,有没有办法获得原始
的
训练
损失
?
浏览 0
提问于2019-03-30
得票数 0
2
回答
验证显示出巨大
的
波动
。可能是什么原因?
image-classification
、
cnn
、
loss-function
我在
训练
CNN来解决三级图像分类问题。我
的
训练
损失
平稳地减少了,这是预期
的
行为。然而,我
的
验证
损失
显示出很大
的
波动
。📷附加信息:我正在微调一个Resnet-18
的
最后一层,它是在ImageNet数据上接受过PyTorch预培训
的
。我必须指出,我在<
浏览 0
提问于2018-05-02
得票数 10
回答已采纳
1
回答
波动
训练
损失
背后
的
直觉
python
、
tensorflow
、
machine-learning
、
data-science
、
autoencoder
以下是我
的
模型
的
总结: =========================,我得到以下图表: 我认为
波动
可能是因为学习率太高,所以我再次尝试了0.00001到0.00002,结果是: 为什么
训练
损失
总是如此
波动
在第一个图表中,这两个
损失
<
浏览 0
提问于2019-05-07
得票数 2
2
回答
一个正常
的
精度图有多少跳跃?
python
、
tensorflow
、
machine-learning
在4个班级上
训练
一个
模型
,并使用TensorBoard跟踪结果。我
的
Graph如下所示:绿线: val精确度您可以看到,我
的
val acc图跳跃得很快。这是正常
的
吗?
浏览 2
提问于2020-08-13
得票数 1
1
回答
基于深度学习
的
多参数恢复
python
、
deep-learning
、
neural-network
、
pytorch
、
regression
作为我实际研究问题
的
一个简化版本,假设我有一个二阶多项式函数y = a_x^2 + b_x +c,我想用一个深神经网络来预测给定变量x和函数y
的
值
的
参数a、b和c,变量x和参数a、b、c在0,1范围内从均匀分布中剔除当我尝试使用不同
的
体系结构、成本函数和超参数组合对网络进行最常用
的
训练
时
,我总是会遇到同样
的
问题:
训练
损失
和测试
损失
迅速收敛到一个明显高于0
的
值,然后开始以
奇怪
浏览 14
提问于2021-12-14
得票数 0
1
回答
验证
损失
较大,验证精度>学习精度,但测试精度较高。我
的
模特是不是太合适了?
optimization
、
deep-learning
、
conv-neural-network
我正在
训练
一个
模型
,使用作者最初
的
学习速率(我也使用他们
的
github ),我得到了一个不断振荡
的
验证
损失
,它会减少,然后突然跳到一个很大
的
值,然后再次下降,但从没有真正收敛到它得到
的
最低值是2(而
训练
损失
收敛到在每一个时代,我得到
训练
的
准确性,在最后,验证
的
准确性。验证精度总是大于
训练
精度。 当我测试真实
的
测试数据
时<
浏览 0
提问于2019-03-26
得票数 9
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
从梯度下降到 Adam!一文看懂各种神经网络优化算法
人工神经网络・ReLU激活函数
Tensorflow学习笔记-模型、图的存储与加载
赛尔推荐 第18期
绕开算力限制,如何用单GPU微调 LLM?这是一份“梯度累积”算法教程
热门
标签
更多标签
云服务器
即时通信 IM
ICP备案
对象存储
实时音视频
活动推荐
运营活动
广告
关闭
领券