机器学习模型在测试数据上的表现比验证数据差_如何从部署在heroku上的机器学习模型中获取数据？ - 腾讯云开发者社区

python、tensorflow

我是机器学习的新手。首先，我想训练一个模型来对猫和狗的图片进行分类。我的问题是，当我训练我的模型时，它给我提供了(大约) 80-85%的训练数据和验证数据的准确性。验证数据和训练数据的损失都很低，约为0.4 - 0.5。因为这些数字非常相似，我想我不会有过度拟合的问题，对

浏览 10提问于2020-12-29得票数 0

回答已采纳

2回答

监督学习中测试数据的目的？

machine-learning、test-data、supervised-learning

测试数据的用途是什么？只是为了计算分类器的准确率吗？我正在使用朴素贝叶斯对推文进行情感分析。一旦我使用训练数据训练我的分类器，我就使用测试数据来计算分类器的准确性。如何使用测试数据来提高分类器的性能？

浏览 0提问于2015-03-02得票数 0

2回答

训练数据集和测试数据集之间的数据冗余-为什么它是坏的(源需要)

machine-learning、data、training

我知道，在火车和测试集中有太多相似的数据是不可以的(例如，两张图片仅相差一个像素)。我试图找到一个科学上有效的解释为什么它是坏的，我指的是在同行评审的期刊上的一篇论文，解释(甚至提到)这一点。几个小时都找不到合适的东西。你知道可靠的消息来源吗？

浏览 0提问于2023-04-11得票数 1

回答已采纳

1回答

模型在测试数据上表现不佳

classification、anomaly-detection

我正在研究一个分析性肿大的检测/分类问题。数据集是不平衡的，所以我使用f1评分作为度量来验证模型的性能。该模型在GridSearchCV拟合过程中表现良好，在测试集上也表现良好。然而，当我用新的数据集测

浏览 5提问于2022-10-09得票数 1

3回答

为什么深度学习模型与机器学习模型相比不稳定？

machine-learning、deep-learning、cnn、logistic-regression、weight-initialization

我想知道为什么深度学习模式如此不稳定。假设我使用相同的数据集多次训练机器学习模型(例如logistic回归)，并多次训练深度学习模型(例如LSTM)。在此之后，我计算了每个模型的平均值及其标准差。深度学习模型的标准差比机器学习模型的标准<e

浏览 0提问于2021-11-09得票数 4

2回答

K折叠交叉验证不会使数据的任何部分对模型盲目。

machine-learning、data-science、cross-validation

我有一个关于K折叠交叉验证的概念性问题。一般情况下，我们根据测试数据训练一个学习模型，并用测试数据对其进行验证，假设系统对这些数据是盲目的，这就是为什么我们可以评估系统是否真的学会了。现在使用k折叠，最后的模型实际上已经(间接地)看到了所有数据，那么为什么它仍然有效？它已经看到了所有的数据，我们不知道它是如何预测未知数据的。这就

浏览 0提问于2022-06-11得票数 -1

1回答

在F1评分指标上训练和验证模型正确吗？

deep-learning、classification、time-series、training、f1score

我试图在多个数据集上做实验。有些人比其他人更不平衡。现在，为了确保公平的报告，我们计算F1分数的测试数据。在大多数机器学习模型中，我们通过精度度量对模型进行训练和验证。然而，这一次，我决定在F1评分度量标准上训练和验证模型。从技术上讲，在我看来，不应该有问题。不过，我想知道这是否正确的

浏览 0提问于2022-01-31得票数 0

1回答

用于机器学习的Python pickle

python

我已经在Windows中构建了一个预测模型，以使用python 3.6.1训练数据集。我使用pickle将列车模型保存为Pickle文件我已经在Windows上获得了成功的结果。现在，我想将训练酸菜文件和Python脚本(使用训练酸菜文件使用测试数据预测模型)移动到具有与windows.But相似版本的py

浏览 1提问于2018-04-21得票数 1

1回答

在发生故障时，使用测试集最终会烧毁数据集吗？

machine-learning

给定一个数据集，我想训练一个机器学习算法。数据分为培训、验证和测试数据。扔掉所有东西，用相同的数据集开始新的工作。然而，这一直是比喻的</e

浏览 0提问于2020-10-16得票数 3

1回答

是否可以拥有与验证历史非常相似的培训历史？

python、keras、plot

我训练了一个50年代的模型，按照以下比例分割数据集： X = np.load(....)从历史上可以看出，验证的准确性/损失与培训的准确性/损失非常相似。有时验证损失

浏览 1提问于2021-01-08得票数 1

回答已采纳

2回答

为什么一遍又一遍地使用相同的测试数据集是不好的？

machine-learning、generalization

我正在跟踪这个谷歌的系列：机器学习速成班。测试集上的良好性能是一般新数据良好性能的有用指标，前提是：为什么第二点是坏的呢？只要没有在训练阶段使用测试集，为什么继续使用相同的测试集来测试模型的性能会有什么不好呢

浏览 0提问于2018-07-20得票数 0

回答已采纳

1回答

迁移学习分割模型在测试数据上的表现明显差

deep-learning、pytorch、transfer-learning、semantic-segmentation

作者采用了一种基于Resnet34权重的迁移学习方法。由于硬件的限制，我不得不将批次的一半从24到12。然而，在训练模型之后，我注意到性能显著下降，三个类中的Dice分数(越高越好)只有5-19-11，而在论文中报告的结果是78-87-82。然而，训练和验证的准确性似乎是正常的，只是模型在测试数据上表现不佳，我选择了在过度拟合

浏览 2提问于2021-03-18得票数 1

回答已采纳

1回答

为什么不在RandomizedSearchCV中评估过测试拟合结果？

python、optimization、hyperparameters、gridsearchcv

我正在尝试在sklearn中优化分类器和回归方法的hiperparameters。我有个问题。为什么在评估结果时，您选择例如最佳训练精度，而不是在测试中评估此结果，并使用其他训练精度迭代其他值以获得最佳测试精度？因为很明显，用于最佳训练精度的参数与用于最佳测试精度的参数不同。谢谢!

浏览 1提问于2019-09-18得票数 0

3回答

机器学习:基于测试数据的训练模型

machine-learning

我想知道一个模型是否也是从测试数据中训练自己，同时对它进行多次评估，从而导致了一个过度拟合的场景。通常，我们将训练数据分成train-test分割，我注意到有些人将它分成3组数据-- train、test和eval。eval是对模型的最终评价。我可能错了，但我的观点是，如果上面提到的场景不是真的，那么就不需要eval数据集。需要澄清一下。

浏览 5提问于2018-01-03得票数 1

回答已采纳

3回答

机器学习项目:在探索性数据分析之前或之后，拆分培训/测试集？

r、machine-learning、data-analysis

在进行任何探索性数据分析之前，最好将数据分成培训和测试集，还是所有的探索都是基于培训数据？我现在正在做探索性数据分析--一开始没有什么特别的，只是从变量分布之类的<

浏览 1提问于2019-01-21得票数 15

2回答

我们是否需要对测试和训练数据集进行预处理？

machine-learning、python、pandas、preprocessing

我得到了两个数据集，在测试和培训数据集中都有缺失的值。我是否也需要对test.csv进行预处理，还是只对train.csv进行预处理？

浏览 0提问于2021-10-17得票数 3

2回答

训练损失和验证损失之间有很大的差距，这是不是很糟糕？

overfitting

假设我的训练损失为0.5，我的验证损失为2.5 (两者都已停止下降，验证损失从未增加)。我显然太适应了。如果增加正则化，我的训练损失为1，验证损失为3.5。第一种模型明显具有较好的验证损失，而第二种模型适用范围较小。应该选择哪种型号？一个更适合的模型是否有可能在看不见的数据上表现更好，或者这是否意味着存在某种类型的</

浏览 0提问于2019-01-25得票数 1

1回答

从培训集复制数据

machine-learning、training

在通过复制记录创建的更大的训练集上训练的模型在测试数据上比在没有重复的数据上训练的模型表现得更好吗？

浏览 0提问于2020-10-08得票数 2

1回答

如何在C++中使用MXNet模型？

c++、mxnet

在我训练了一个模型之后，我如何在C++中使用它？

浏览 0提问于2017-11-15得票数 1

2回答

为什么超参数调优发生在验证数据集上，而不是在一开始？

machine-learning、deep-learning、neural-network、hyperparameter-tuning、hyperparameter

尽管做了/使用过几次，但我仍然对使用验证集进行超参数调优感到有点困惑。据我所知，我选择一个模型，对训练数据进行训练，对训练数据进行性能评估，然后对验证数据进行超参数整定评估模型性能，然后选择最佳模型并对测试数据进行测试。为了做到这一点，我基本上需要随机选择一个模型来训练数据。我不明白的是，我不知道哪一种模式在一开始会是最好的</

浏览 0提问于2022-05-28得票数 0

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云