Loading [MathJax]/jax/input/TeX/config.js
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
社区首页 >问答首页 >为什么第一个时期的验证准确率高于训练准确率?

为什么第一个时期的验证准确率高于训练准确率?
EN

Stack Overflow用户
提问于 2020-07-13 06:34:38
回答 1查看 783关注 0票数 0

我正在处理一个5类的视频分类,并使用TimeDistributed CNN + RNN模型。训练数据集包含70个视频,每个类包含20个帧。验证数据集包含15个视频,每个类包含20个帧。测试数据集包含15个视频,每个类包含20个帧。我使用的批处理大小是64。所以,我总共处理了500个视频。我使用RmsProp优化器和分类cross_entropy损失编译了模型。

我已经用65 epochs.But训练了模型我注意到一个奇怪的事实,在第一个epoch.However时,验证精度比训练精度高,在剩下的时间段,曲线看起来非常令人满意。

我的模型是:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
model = Sequential()

input_shape=(20, 128, 128, 3)

model.add(BatchNormalization(input_shape=(20, 128, 128, 3)))

model.add(TimeDistributed(Conv2D(32, (3, 3), strides=(1, 1),activation='relu', padding='same')))
model.add(TimeDistributed(MaxPooling2D((2, 2))))
model.add(TimeDistributed(Conv2D(64, (3, 3), strides=(1, 1),activation='relu', padding='same')))
model.add(TimeDistributed(Conv2D(128, (3, 3), strides=(1, 1),activation='relu', padding='same')))
model.add(TimeDistributed(Conv2D(128, (3, 3), strides=(1, 1),activation='relu', padding='same')))
model.add(TimeDistributed(MaxPooling2D((2, 2))))
model.add(TimeDistributed(Conv2D(256, (3, 3), strides=(1, 1),activation='relu', padding='same')))
model.add(TimeDistributed(MaxPooling2D((2, 2))))

model.add(TimeDistributed(Flatten()))

model.add(LSTM(256, activation='relu', return_sequences=False))
model.add((Dense(128,activation='relu')))

model.add(Dense(5, activation='softmax'))

谁能告诉我为什么在第一个时期验证准确率比训练准确率更高?

EN

回答 1

Stack Overflow用户

发布于 2020-07-13 06:39:27

我的猜测是,因为你只有5个类,通过猜测所有帧的一个将会给你20%的准确率。现在你有大约32%,所以稍微好一点。

我通常不看初始精度,因为模型真的很差。(实际上,从绘图中删除前N个时期(在本例中,可能是20/30),以更好地显示性能)。

在第一个时期之后检查混淆矩阵,你可能只会擅长几个类。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/62870408

复制
相关文章
为什么神经网络模型在测试集上的准确率高于训练集上的准确率?
如上图所示,有时候我们做训练的时候,会得到测试集的准确率或者验证集的准确率高于训练集的准确率,这是什么原因造成的呢?经过查阅资料,有以下几点原因,仅作参考,不对的地方,请大家指正。
种花家的奋斗兔
2020/11/13
5.3K0
为什么神经网络模型在测试集上的准确率高于训练集上的准确率?
训练集准确率很高,验证集准确率低问题
训练集在训练过程中,loss稳步下降,准确率上升,最后能达到97% 验证集准确率没有升高,一直维持在50%左右(二分类问题,随机概率) 测试集准确率57% 在网上搜索可能打的原因: 1.learning rate太小,陷入局部最优
全栈程序员站长
2022/11/04
3.6K0
训练集准确率很高,验证集准确率低问题
提升网络训练的准确率
mnist 数据集有60000张图片作为训练数据,10000张图片作为测试数据。假设现在选择 Batch_Size = 100对模型进行训练。迭代30000次。
算法与编程之美
2023/01/03
3300
训练多个epoch来提高训练模型的准确率
对模型进行训练后,测试集测试的结果与真实值之间的占比称为准确率,准确率往往是评估网络的一个重要指标。而用同一数据集训练神经网络,每次训练得到的准确率结果却不一样并且准确率都较低,最高仅67%,那如何才能提高训练后的准确率呢?
算法与编程之美
2023/01/03
1.1K0
训练多个epoch来提高训练模型的准确率
准确率和召回率及如何提高准确率
精确率 = 提取出的正确信息条数 / 提取出的信息条数 召回率 = 提取出的正确信息条数 / 样本中的信息条数
DuncanZhou
2018/09/04
7.5K0
测试集的分类准确率
使用上述过程即可使用kNN算法(k取3),且对测试集进行预测的准确率达到99.16%以上
Hsinyan
2022/06/19
5660
测试集的分类准确率
机器学习-如何训练数据调整参数让准确率更高?
今天我要回顾并强化概念。为此,我们要进行两项探索首先,我们会编码一个基本管道进行监督学习。我会向大家展示多个分类器如何解决同一个问题。然后,我们要锐化直觉关于一个算法从数据中学习的真正含义,因为尽管听起来这很魔幻,实际上一点也不。为了扫平障碍,我们来看一个常见的你可能想要进行的实验。
XXXX-user
2019/09/04
1.6K0
机器学习-如何训练数据调整参数让准确率更高?
使用resnet, inception3进行fine-tune出现训练集准确率很高但验证集很低的问题
最近用keras跑基于resnet50,inception3的一些迁移学习的实验,遇到一些问题。通过查看github和博客发现是由于BN层导致的,国外已经有人总结并提了一个PR(虽然并没有被merge到Keras官方库中),并写了一篇博客,也看到知乎有人翻译了一遍:Keras的BN你真的冻结对了吗
机器学习AI算法工程
2020/10/19
2.3K0
使用resnet, inception3进行fine-tune出现训练集准确率很高但验证集很低的问题
f1值准确率召回率_nt值准确率高吗
混淆矩阵中T、F、P、N的含义: T:真,F:假,P:阳性,N:阴性 然后组合: TP:真阳性 TN:真阴性 FP:假阳性 FN:假阴性
全栈程序员站长
2022/09/20
3440
f1值准确率召回率_nt值准确率高吗
[知乎作答]·关于在Keras中多标签分类器训练准确率问题
本文来自知乎问题 关于在CNN中文本预测sigmoid分类器训练准确率的问题?中笔者的作答,来作为Keras中多标签分类器的使用解析教程。
小宋是呢
2019/06/27
2.1K0
[知乎作答]·关于在Keras中多标签分类器训练准确率问题
为什么我的模型准确率都 90% 了,却不起作用?
二元分类中有一类情况,原始数据集中的两个类出于问题性质的原因,导致其中数据点分布不平衡。举例来说,在处理用户流失(指用户在一段时间之后不再继续使用公司产品的情况)这类市场问题预测时,流失用户所占的百分比一般都会远低于留存用户的。如果说这个例子里分类是八比二的话,那么只会有 20% 的用户终止了与公司继续接触,剩下 80% 的用户则会继续使用公司产品。
深度学习与Python
2022/03/23
1.9K0
为什么我的模型准确率都 90% 了,却不起作用?
提高模型准确率:组合模型
各位朋友,新年好! 随着春节假期的结束,想必大家陆陆续续返回工作岗位,开始新的一年的拼搏。我也会继续努力,争取在深度学习方面更进一步,接下来,我将继续聊一聊深度学习在计算机视觉中的应用。
云水木石
2019/07/01
5990
索尼刷新纪录,训练ImageNet仅用224秒,准确率达75%
索尼的研究人员宣布了训练ImageNet / ResNet 50的新纪录,通过使用2100个NVIDIA Tesla V100 Tensor Core GPU,仅用224秒(3分44秒)就可以获得75%的准确率,对于ResNet-50来说这是训练时间是最短的。
AiTechYun
2018/12/13
7580
索尼刷新纪录,训练ImageNet仅用224秒,准确率达75%
DeepMind助力Waymo!提升自动驾驶AI准确率,还能加快模型训练
现实世界中,Waymo已经行驶了1000多万英里(约1600万公里),而在模拟驾驶中,行驶里程更是达到100亿英里。
量子位
2019/07/30
3260
如何基于Paddle快速训练一个98%准确率的抑郁文本预测模型?
Paddle是一个比较高级的深度学习开发框架,其内置了许多方便的计算单元可供使用。
abs_zero
2020/11/26
9960
如何基于Paddle快速训练一个98%准确率的抑郁文本预测模型?
非常时期,搜狗新一代“AI笔皇”问世!支持同声传译,转写准确率98%
全副武装的川总先介绍了疫情爆发后搜狗的举措,包括第一时间捐赠了7000万元的物资和现金支援抗疫一线、全网第一个上线了确诊患者的同城查询、推出第一个用于省级疫情报务平台的新冠肺炎人工智能查询平台、并为一线记者免费配备搜狗AI录音笔C1 Pro……
新智元
2020/03/03
4860
非常时期,搜狗新一代“AI笔皇”问世!支持同声传译,转写准确率98%
ECCV 2022 | 无需下游训练,Tip-Adapter大幅提升CLIP图像分类准确率
机器之心专栏 机器之心编辑部 本文提出了 Tip-Adapter,一种可以免于训练的将 CLIP 用于下游 few-shot 图像分类的方案。 论文链接:https://arxiv.org/pdf/2207.09519.pdf 代码链接:https://github.com/gaopengcuhk/Tip-Adapter 一.研究背景 对比性图像语言预训练模型(CLIP)在近期展现出了强大的视觉领域迁移能力,可以在一个全新的下游数据集上进行 zero-shot 图像识别。为了进一步提升 CLIP 的迁移性
机器之心
2022/09/26
1K0
ECCV 2022 | 无需下游训练,Tip-Adapter大幅提升CLIP图像分类准确率
mnist图片缺失 97%的像素,mnist add准确率84%;及15位的加法训练
paper: Neural-Probabilistic Answer Set Programming
CreateAMind
2023/02/14
2410
mnist图片缺失 97%的像素,mnist add准确率84%;及15位的加法训练
机器学习中分类准确率的评估方法
对机器学习的分类结果进行分析是一个很重要的过程,之前一直忽略了这一个过程,一直到使用了Scikit-learn之后才发现有一堆不懂的名词需要学习。下面主要解释下混淆矩阵、准确率、召回率、f1-score等概念。这些概念其实也是模式识别和信息检索里面经常碰到的东西。
mythsman
2022/11/14
6640
点击加载更多

相似问题

测试准确率高于训练准确率

10

为什么我的验证准确率比训练准确率高很多,但测试准确率只有0.5?

3181

准确率较低,即预测准确率为52%,而训练期间的训练和验证准确率约为92%

27

验证损失和验证准确率都高于训练损失和acc和波动。

166

为什么验证准确率保持在75%,而训练准确率是100%?

2165
添加站长 进交流群

领取专属 10元无门槛券

AI混元助手 在线答疑

扫码加入开发者社群
关注 腾讯云开发者公众号

洞察 腾讯核心技术

剖析业界实践案例

扫码关注腾讯云开发者公众号
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
查看详情【社区公告】 技术创作特训营有奖征文