Loading [MathJax]/jax/input/TeX/config.js

开发者社区

文档建议反馈控制台

文章/答案/技术大牛

发布

社区首页 >问答首页 >为什么第一个时期的验证准确率高于训练准确率？

问为什么第一个时期的验证准确率高于训练准确率？
EN

Stack Overflow用户

提问于 2020-07-13 06:34:38

回答 1查看 783关注 0票数 0

我正在处理一个5类的视频分类，并使用TimeDistributed CNN + RNN模型。训练数据集包含70个视频，每个类包含20个帧。验证数据集包含15个视频，每个类包含20个帧。测试数据集包含15个视频，每个类包含20个帧。我使用的批处理大小是64。所以，我总共处理了500个视频。我使用RmsProp优化器和分类cross_entropy损失编译了模型。

我已经用65 epochs.But训练了模型我注意到一个奇怪的事实，在第一个epoch.However时，验证精度比训练精度高，在剩下的时间段，曲线看起来非常令人满意。

我的模型是：

model = Sequential()

input_shape=(20, 128, 128, 3)

model.add(BatchNormalization(input_shape=(20, 128, 128, 3)))

model.add(TimeDistributed(Conv2D(32, (3, 3), strides=(1, 1),activation='relu', padding='same')))
model.add(TimeDistributed(MaxPooling2D((2, 2))))
model.add(TimeDistributed(Conv2D(64, (3, 3), strides=(1, 1),activation='relu', padding='same')))
model.add(TimeDistributed(Conv2D(128, (3, 3), strides=(1, 1),activation='relu', padding='same')))
model.add(TimeDistributed(Conv2D(128, (3, 3), strides=(1, 1),activation='relu', padding='same')))
model.add(TimeDistributed(MaxPooling2D((2, 2))))
model.add(TimeDistributed(Conv2D(256, (3, 3), strides=(1, 1),activation='relu', padding='same')))
model.add(TimeDistributed(MaxPooling2D((2, 2))))

model.add(TimeDistributed(Flatten()))

model.add(LSTM(256, activation='relu', return_sequences=False))
model.add((Dense(128,activation='relu')))

model.add(Dense(5, activation='softmax'))

谁能告诉我为什么在第一个时期验证准确率比训练准确率更高？

conv-neural-network

EN

回答 1

Stack Overflow用户

发布于 2020-07-13 06:39:27

我的猜测是，因为你只有5个类，通过猜测所有帧的一个将会给你20%的准确率。现在你有大约32%，所以稍微好一点。

我通常不看初始精度，因为模型真的很差。(实际上，从绘图中删除前N个时期(在本例中，可能是20/30)，以更好地显示性能)。

在第一个时期之后检查混淆矩阵，你可能只会擅长几个类。

票数 0

EN

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/62870408

复制

相关文章

为什么神经网络模型在测试集上的准确率高于训练集上的准确率？

https 网络安全腾讯云测试服务神经网络

如上图所示，有时候我们做训练的时候，会得到测试集的准确率或者验证集的准确率高于训练集的准确率，这是什么原因造成的呢？经过查阅资料，有以下几点原因，仅作参考，不对的地方，请大家指正。

种花家的奋斗兔

2020/11/13

5.3K0

为什么神经网络模型在测试集上的准确率高于训练集上的准确率？

训练集准确率很高，验证集准确率低问题

批量计算 spring https 网络安全 keras

训练集在训练过程中，loss稳步下降，准确率上升，最后能达到97% 验证集准确率没有升高，一直维持在50%左右（二分类问题，随机概率）测试集准确率57% 在网上搜索可能打的原因： 1.learning rate太小，陷入局部最优

全栈程序员站长

2022/11/04

3.6K0

训练集准确率很高，验证集准确率低问题

提升网络训练的准确率

mnist 数据集有60000张图片作为训练数据，10000张图片作为测试数据。假设现在选择 Batch_Size = 100对模型进行训练。迭代30000次。

算法与编程之美

2023/01/03

3300

训练多个epoch来提高训练模型的准确率

腾讯云测试服务神经网络

对模型进行训练后，测试集测试的结果与真实值之间的占比称为准确率，准确率往往是评估网络的一个重要指标。而用同一数据集训练神经网络，每次训练得到的准确率结果却不一样并且准确率都较低，最高仅67%，那如何才能提高训练后的准确率呢？

算法与编程之美

2023/01/03

1.1K0

训练多个epoch来提高训练模型的准确率

准确率和召回率及如何提高准确率

精确率 = 提取出的正确信息条数 / 提取出的信息条数召回率 = 提取出的正确信息条数 / 样本中的信息条数

DuncanZhou

2018/09/04

7.5K0

测试集的分类准确率

腾讯云测试服务 scikit-learn 机器学习神经网络深度学习

使用上述过程即可使用kNN算法(k取3)，且对测试集进行预测的准确率达到99.16%以上

Hsinyan

2022/06/19

5660

机器学习-如何训练数据调整参数让准确率更高？

监督学习编程算法

今天我要回顾并强化概念。为此，我们要进行两项探索首先，我们会编码一个基本管道进行监督学习。我会向大家展示多个分类器如何解决同一个问题。然后，我们要锐化直觉关于一个算法从数据中学习的真正含义，因为尽管听起来这很魔幻，实际上一点也不。为了扫平障碍，我们来看一个常见的你可能想要进行的实验。

XXXX-user

2019/09/04

1.6K0

机器学习-如何训练数据调整参数让准确率更高？

使用resnet， inception3进行fine-tune出现训练集准确率很高但验证集很低的问题

keras 批量计算腾讯云测试服务深度学习迁移学习

最近用keras跑基于resnet50，inception3的一些迁移学习的实验，遇到一些问题。通过查看github和博客发现是由于BN层导致的，国外已经有人总结并提了一个PR（虽然并没有被merge到Keras官方库中），并写了一篇博客，也看到知乎有人翻译了一遍：Keras的BN你真的冻结对了吗

机器学习AI算法工程

2020/10/19

2.3K0

使用resnet， inception3进行fine-tune出现训练集准确率很高但验证集很低的问题

f1值准确率召回率_nt值准确率高吗

http https java 网络安全

混淆矩阵中T、F、P、N的含义： T:真，F:假，P:阳性，N:阴性然后组合： TP:真阳性 TN:真阴性 FP:假阳性 FN:假阴性

全栈程序员站长

2022/09/20

3440

f1值准确率召回率_nt值准确率高吗

[知乎作答]·关于在Keras中多标签分类器训练准确率问题

机器学习神经网络深度学习人工智能 keras

本文来自知乎问题关于在CNN中文本预测sigmoid分类器训练准确率的问题？中笔者的作答，来作为Keras中多标签分类器的使用解析教程。

小宋是呢

2019/06/27

2.1K0

[知乎作答]·关于在Keras中多标签分类器训练准确率问题

为什么我的模型准确率都 90% 了，却不起作用？

编程算法机器学习神经网络深度学习人工智能

二元分类中有一类情况，原始数据集中的两个类出于问题性质的原因，导致其中数据点分布不平衡。举例来说，在处理用户流失（指用户在一段时间之后不再继续使用公司产品的情况）这类市场问题预测时，流失用户所占的百分比一般都会远低于留存用户的。如果说这个例子里分类是八比二的话，那么只会有 20% 的用户终止了与公司继续接触，剩下 80% 的用户则会继续使用公司产品。

深度学习与Python

2022/03/23

1.9K0

为什么我的模型准确率都 90% 了，却不起作用？

提高模型准确率：组合模型

迁移学习深度学习机器学习图像处理神经网络

各位朋友，新年好! 随着春节假期的结束，想必大家陆陆续续返回工作岗位，开始新的一年的拼搏。我也会继续努力，争取在深度学习方面更进一步，接下来，我将继续聊一聊深度学习在计算机视觉中的应用。

云水木石

2019/07/01

5990

索尼刷新纪录，训练ImageNet仅用224秒，准确率达75%

深度学习神经网络分布式容器

索尼的研究人员宣布了训练ImageNet / ResNet 50的新纪录，通过使用2100个NVIDIA Tesla V100 Tensor Core GPU，仅用224秒（3分44秒）就可以获得75％的准确率，对于ResNet-50来说这是训练时间是最短的。

AiTechYun

2018/12/13

7580

索尼刷新纪录，训练ImageNet仅用224秒，准确率达75%

DeepMind助力Waymo!提升自动驾驶AI准确率，还能加快模型训练

编程算法自动驾驶无人驾驶

现实世界中，Waymo已经行驶了1000多万英里（约1600万公里），而在模拟驾驶中，行驶里程更是达到100亿英里。

量子位

2019/07/30

3260

如何基于Paddle快速训练一个98%准确率的抑郁文本预测模型？

python typescript 神经网络深度学习

Paddle是一个比较高级的深度学习开发框架，其内置了许多方便的计算单元可供使用。

abs_zero

2020/11/26

9960

如何基于Paddle快速训练一个98%准确率的抑郁文本预测模型？

非常时期，搜狗新一代“AI笔皇”问世！支持同声传译，转写准确率98%

语音识别人工智能

全副武装的川总先介绍了疫情爆发后搜狗的举措，包括第一时间捐赠了7000万元的物资和现金支援抗疫一线、全网第一个上线了确诊患者的同城查询、推出第一个用于省级疫情报务平台的新冠肺炎人工智能查询平台、并为一线记者免费配备搜狗AI录音笔C1 Pro……

新智元

2020/03/03

4860

非常时期，搜狗新一代“AI笔皇”问世！支持同声传译，转写准确率98%

ECCV 2022 | 无需下游训练，Tip-Adapter大幅提升CLIP图像分类准确率

机器之心专栏机器之心编辑部本文提出了 Tip-Adapter，一种可以免于训练的将 CLIP 用于下游 few-shot 图像分类的方案。论文链接：https://arxiv.org/pdf/2207.09519.pdf 代码链接：https://github.com/gaopengcuhk/Tip-Adapter 一．研究背景对比性图像语言预训练模型（CLIP）在近期展现出了强大的视觉领域迁移能力，可以在一个全新的下游数据集上进行 zero-shot 图像识别。为了进一步提升 CLIP 的迁移性

机器之心

2022/09/26

1K0

ECCV 2022 | 无需下游训练，Tip-Adapter大幅提升CLIP图像分类准确率

mnist图片缺失 97%的像素，mnist add准确率84%；及15位的加法训练

github https git 开源网络安全

paper： Neural-Probabilistic Answer Set Programming

CreateAMind

2023/02/14

2410

mnist图片缺失 97%的像素，mnist add准确率84%；及15位的加法训练

机器学习中分类准确率的评估方法

机器学习神经网络深度学习人工智能

对机器学习的分类结果进行分析是一个很重要的过程，之前一直忽略了这一个过程，一直到使用了Scikit-learn之后才发现有一堆不懂的名词需要学习。下面主要解释下混淆矩阵、准确率、召回率、f1-score等概念。这些概念其实也是模式识别和信息检索里面经常碰到的东西。

mythsman

2022/11/14

6640

点击加载更多

相似问题

测试准确率高于训练准确率

10

为什么我的验证准确率比训练准确率高很多，但测试准确率只有0.5？

3181

准确率较低，即预测准确率为52%，而训练期间的训练和验证准确率约为92%

27

验证损失和验证准确率都高于训练损失和acc和波动。

166

为什么验证准确率保持在75%，而训练准确率是100%？

2165

添加站长进交流群

领取专属 10元无门槛券

AI混元助手 在线答疑

关注 腾讯云开发者公众号

洞察 腾讯核心技术

剖析业界实践案例