为什么我的二进制分类模型不学习，甚至过拟合？_我不能理解我的CNN多类分类模型是否过拟合？ - 腾讯云开发者社区

python、machine-learning、scikit-learn

我是机器学习的新手，如果有任何帮助我将不胜感激。我正在研究一个具有小数据集(110个样本)的监督二进制分类问题，在这个问题中，我选择了一些模型进行尝试，并使用交叉验证的网格搜索执行超参数调整。然后，我使用以下代码为每个模型生成了学习曲线： from yellowbrick.model_selection import LearningCurve final_models = [("KNN", knn_final), ("SVMRBF", svm_final), ("RandomFore

浏览 0提问于2021-04-23得票数 1

1回答

分类分类的自定义阈值

classification、optimization、methodology

在评估二进制分类任务时，可以通过多种方法搜索特定的阈值，以便在某些度量(f1、recall等)上获得更好的评分。不幸的是，该方法似乎不能应用于分类(两个以上的类)任务。我已经考虑过在一个已经训练过的模型之上训练一个简单的分类器(SVC，Log，.，Tree)，以便找到最佳阈值来应用于输出，以最大限度地提高结果的相似性。我提出的工作流程是训练一个训练集的模型并对其进行评估，然后利用该模型的训练集上的输出作为另一个模型的入口，该模型可以学习如何处理训练集上的阈值，以最大限度地提高训练集上的地面真相的相似性(所有这些步骤都使用相同的策略进行验证)。我从没听说过这件事，我想知道这是否有意义？

浏览 0提问于2021-04-05得票数 0

1回答

在迁移学习中将小损失最小化到零损失

deep-learning、transfer-learning

我之所以问这个问题，是因为我注意到，在比赛中，人们倾向于将损失降至0。我有一个“图像二进制分类”的问题，我已经通过一个“从零开始训练”的迁移学习模型实现了binary_crossentropy_loss到0.003。我如何才能进一步将其减少到0？我是应该再次微调模型，还是应该回去进行图像特征工程？ ? 另外，根据这里的图片，我想我遇到的是“消失的梯度”而不是“过拟合”。如果是这样，我下一步应该怎么做？谢谢!

浏览 28提问于2020-10-08得票数 0

回答已采纳

1回答

验证准确率在达到90%后保持不变

tensorflow、keras、classification

? 我正在使用迁移学习技术进行医学图像分类。然而，模型在达到88-89%后开始过拟合。我使用了空间droupout，增强，但没有帮助。我想要达到很好的准确性。我很感谢专家的帮助。谢谢

浏览 29提问于2020-04-03得票数 0

1回答

正则化的概率建模(logistic?)python回归模型

scikit-learn、regression、linear-regression、logistic-regression、statsmodels

我想用回归模型来拟合概率。我知道线性回归经常用于这个目的，但我有几个概率在0.0和1.0左右，并且想要拟合一个回归模型，其中输出被限制在0.0到1.0之间。我希望能够为模型指定正则化规范和强度，最好在python中这样做(但R实现也会有帮助)。我发现的所有逻辑回归包似乎只适合于分类，而这是一个回归问题(尽管我想使用logit链接函数)。我使用scikits为我的分类和回归需求学习，所以如果这个回归模型可以在scikits中实现，那就太棒了(在我看来，这是不可能的)，但是我很乐意在python和/或R中找到任何解决方案。

浏览 4提问于2015-11-21得票数 3

1回答

使用TensorFlow进行姿势识别

python、opencv、tensorflow、machine-learning、google-cloud-platform

我正在尝试使用机器学习根据特定的姿势对人的图像进行分类。我收集的图像类别是“姿势”或“未知”。我有很多人摆姿势的照片，也有不摆姿势的人的照片。该模型似乎过度拟合了“姿势”类别，因为当我将相机的焦点对准任何人以外的任何人时，它也显示了“姿势”类别的自信得分，而不是“未知”类别。我在想，我是否应该在“未知”集合中包含大量随机性的照片来帮助解决这个问题？如果我添加了大量的这些照片，我是否应该添加等量的“姿势”照片，以避免在模型中引入偏差？此外，我还考虑过在输入ML模型之前使用OpenCV对轮廓图像进行预处理，对此有什么想法吗？如果有帮助的话，我正在学习教程。提前感谢您的任何建议！

浏览 2提问于2018-04-12得票数 0

1回答

是否有可能在训练精度较低的情况下过度拟合？

deep-learning

我正在处理文档分类问题，并尝试应用基本的RNN/LSTM模型。我制作了多层LSTM模型，并用15个时期进行了训练，但我获得了大约53%的训练准确率。41%的测试访问率。当我用更大的时代训练时，训练acc。增加和测试访问权限。下降到33%左右。我知道如果测试访问。低于训练ac.，它可能是过拟合的。而过拟合的原因是，模型甚至训练了训练数据集的噪声。但我认为，如果发生了过度拟合，训练是可行的。必须是相当高的(80-90%)和测试访问。这比这要低得多，因为过拟合意味着模型对于训练数据集来说是“过拟合”的。现在我想知道为什么当我用15个时期训练时，我的准确率降低了10%，而训练准确率只有53%。它

浏览 0提问于2020-04-24得票数 0

1回答

建立深度学习模型

classification、deep-learning、model-selection

我想为一个二元分类问题建立一个深入的学习模型。我有16个特征和50k样本。如何为我的问题选择每一层的层数和神经元数？请分享解释相同的链接。

浏览 0提问于2017-05-05得票数 0

1回答

基于高斯朴素贝叶斯的多类分类

machine-learning、scikit-learn、data-science、naivebayes、multiclass-classification

我知道朴素贝叶斯擅长二进制分类，但我想知道多类分类是如何工作的。例如:我之前使用朴素贝叶斯进行文本分类，对文本进行矢量化以查找文档中每个单词的概率，然后使用矢量化数据来适应朴素贝叶斯分类器。现在，我正在处理如下数据： A、B、C、D、E、F、G 210,203，0，30,710,2587452，0 273,250，0，30,725,3548798，1 283,298，0，31,785,3987452，3 在上述数据中，有6个特征( and )，G是具有值(0、1或2)的类。我在dataset中有将近70000个条目具有类(输出) 1、2或3。在将数据分成测试数据和训练数据后，我将训练数

浏览 4提问于2017-11-25得票数 2

回答已采纳

2回答

如果测试精度足够高的话，过度拟合还可以吗？

scikit-learn、random-forest、overfitting

我正在尝试构建一个二进制分类器。我尝试过各种不同结构和参数的深层神经网络，没有比 Train set accuracy : 0.70102 Test set accuracy : 0.70001 然后，我尝试了机器学习算法，如KNN和决策树等，我发现来自Scikit-学习和n_estimators=100的随机林分类器给了我 Train set accuracy : 1.0 Test set accuracy : 0.924068 我尝试过调整其他参数，如max_depth、criterion等，但训练集精度的下降也导致了测试集的精度下降。喜欢 Train set accuracy : 0.8

浏览 0提问于2020-05-23得票数 8

回答已采纳

4回答

如何知道模型已经开始过火了？

neural-network、overfitting

我希望以下摘录将提供一个洞察我的问题将是什么。这些是来自这里的。然后，学习逐渐减缓。最后，在280年代前后，分类精度几乎停止了提高。后来的年代只是在280年代的精度值附近看到了小的随机波动。与之前的图表相比，与培训数据相关的成本继续平稳下降。如果我们只看这一成本，我们的模式似乎仍在“变得更好”。但测试精度的结果表明，改进是一种幻想。就像费米不喜欢的模型一样，我们的网络在800年后所学习的东西不再推广到测试数据中。所以这是没有用的学习。我们说网络是过度适应或过度训练超过时代280。我们正在训练一个神经网络，训练数据的成本(训练数据)一直下降到400年代，但在280年代以后，分类精度变得静态(

浏览 0提问于2017-05-22得票数 12

1回答

ML中的终极挑战仅仅是计算能力吗？

machine-learning、cross-validation、machine-learning-model、model-selection

我在学习机器学习方面遇到了一个理论上的障碍，因为我还没有看到这一点在任何地方都得到明确的解决。在我的研究中，似乎交叉验证(或者它的某些变体，比如LOOCV，或者潜在的另一种，但类似的，验证方案，比如引导)似乎是模型选择的全部。通过穷举CV选择模型及其参数，使拟合最大化，同时平衡过拟合，似乎是建立模型的最佳方法，计算能力也越来越低。那么，人类分析师还有什么可做的呢？我为这个业余的问题事先道歉，但是谁能为我填补这个空白，并有可能建议一些关于模型选择的消息来源？

浏览 0提问于2018-11-07得票数 2

回答已采纳

2回答

我的学习曲线是否过正？

python、machine-learning、neural-network、classification、overfitting-underfitting

我正致力于多分类任务(总共6个班)，并获得了几乎完美的训练和测试的准确性(超过99%)的基础上，我的训练cnn模型。我想知道，我受过训练的模特是否有过度适应的问题。附件是该模型的损失和准确性的学习曲线。整个训练数据集包含大约30k样本，训练与验证数据的比率为4:1。我的损失曲线是否显示过拟合？

浏览 7提问于2022-10-10得票数 -1

回答已采纳

4回答

衡量机器学习模型是否过度拟合的正确方法是什么？

machine-learning、data-mining

我理解过拟合和欠拟合的直观含义。现在，给定一个基于训练数据训练的特定机器学习模型，您如何判断训练是过拟合还是欠拟合数据？有没有一种量化的方法来衡量这些因素？我们能不能看看误差，然后说它是过拟合还是欠拟合？

浏览 0提问于2012-09-15得票数 4

回答已采纳

1回答

将pandas数据帧转换为categorical for keras

python、pandas、machine-learning、keras

我正在尝试用python对数据进行预处理，以便在深度学习keras函数中使用。在模型拟合中，我使用categorical crossentropy作为损失函数。它需要分类变量作为目标。我的目标数据示例： y_train = y_train.astype('category') y_train.head() truth 0 0 1 0 2 1 3 0 4 0 当我尝试将数据框列转换为分类列时： num_classes=2

浏览 8提问于2019-04-03得票数 2

回答已采纳

1回答

keras RNN中的误差非常低，但准确率很低

model、neural-network、loss、rnn

这更像是一个理论问题。如果我在一个二进制分类中有一个接近于零的交叉熵损失，其中最后一层是softmax，输入层是LSTM，那么在训练集上准确率最高达到54%有意义吗？我会假设它会过拟合数据，如果我有这么低的损失，那么我就会有一个非常高精度的过拟合函数。我也尝试了不同的学习率，0.01，0.001，0.0001，都有完全相同的结果。我还在第一个LSTM下添加了第二个LSTM层，以增加模型的复杂性，从而故意使模型过拟合，但这也没有做任何事情。我错过了什么理论概念？ model.add(LSTM(64, input_shape=(100000,26), return_sequences = Tr

浏览 0提问于2017-09-07得票数 0

1回答

R中K近邻文本分类器的KFold交叉验证

r、validation、knn、text-classification

我已经创建了一个文本分类器，它将评论分类为各种类别，例如 Comment Category Good Service provided Service Excellent Communication Communication 我已经使用以下命令进行了分类： knn(modeldata[train, ], modeldata[test,] , cl[train], k =2, use.all = TRUE) 现在我想使用K-折叠交叉验证来评估这个模型。我正在等待

浏览 1提问于2016-10-17得票数 1

1回答

如果神经网络的性能总是很差，即使在寻址过拟合之后，该怎么办？

machine-learning、deep-learning、neural-network、computer-vision、conv-neural-network

我有一个医学图像数据集~10K 256x256图像，用它我正在训练一个用于疾病分类的深层神经分类器。我一直在与InceptionV3和ResNets等流行的CNN合作。这些模型已经在50-60%的范围内达到了验证集的准确性，我注意到它们太合适了。因此，为了提高性能，我尝试了一些常见的策略，比如密集层的辍学、较小的学习率和L2正则化。在这些修改没有显示过拟合的减少后，我接下来转向更小和更简单的架构，只有2-3卷积层+1FC分类层，我认为这将缓解这个问题。然而，在简单的模型中，学习曲线仍然显示出过度拟合的迹象。特别是，当对100个历元进行训练时，模型在前20-30个时期会有相似的训练和验证损失，

浏览 8提问于2022-05-19得票数 -1

1回答

在KNN中，为什么数据是模型？

machine-learning、knn、nearest-neighbor

在机器学习讲座幻灯片中，有人说没有针对KNN的特定模型，其中数据是KNN的模型。之前的任务是最近中心分类器(NCC)，其中有两种方法，一种是fit_ncc，另一种是predict_ncc。因此，fit_ncc创建了一个模型，predict_ncc使用这个模型进行预测。然而，对于KNN，它被写入数据就是模型。这句话我不清楚，我的问题是为什么数据是KNN的模型？请看附件截图：

浏览 0提问于2020-05-20得票数 1

1回答

堆叠模型性能？

classification、svm、probability、ensemble-modeling

我目前正在使用一个看起来非常容易分离的数据集，对于支持向量机，我的准确率为99% (NN-98%，RF-98%，DT-96-97%，我已经检查了泄漏和过度拟合)。作为我的项目的一部分，我也在学习如何实现一个混合模型，但它的准确性也是99% (1记录错误分类)。它似乎是错误地分类相同的记录与支持向量机和其他任何算法似乎没有得到正确的记录。概率- RF和Logistic回归的概率为0.5~0.7，而其它模型对错误预测的概率为0.9-1。我在想我现在该怎么做。在叠加模型中，我是否可以使用某些技术将概率降到0.5以下，从而使其不再按照目前的方式进行分类？我正在使用StackingCVClassifie

浏览 0提问于2020-07-02得票数 2

回答已采纳

1回答

将单标签分类器转换为多标签分类器

python、deep-learning、classification、image-recognition、multiclass-classification

嗨伙计们！为了继续我的问题:我有一个简单的图像分类器(2 2conv+ 2fc)，它在我的数据集(95% acc)上做得很好。然而，我被要求把它变成一个多标签分类器，这是通过改变： self.cost = tf.reduce_mean(tf.nn.softmax_cross_entropy_with_logits_v2( labels=self.labels, logits=self.out) ) 转入： self.cost = tf.reduce_mean(tf.nn.sigmoid_cross_entropy_with_logits (

浏览 0提问于2018-07-18得票数 0

1回答

包括指数列作为模型的预测指标？

machine-learning、classification、logistic-regression

我有一个小的数据集，包括1000个观察(行)、11个预测器+1个响应(12列)。这是一个玩具数据集，用于大学机器学习课程中的学习目的--二进制分类(心脏病与无心脏病)。我对logistic回归、SVM和KNN进行了拟合。但是，我使用的是python，我正在删除一些与丢失的值和异常值相对应的行--使用df.drop()和reset_index()。如果您不将reset_index的drop标志设置为true，您将在数据帧中得到一个列，其中包含要重置的索引。我不小心忘记将标志设置为true，在拟合时，所提到的3种模型都包含了带有这些索引的列。这给了我99-100%的F1分数。当我意识到我意外地包

浏览 0提问于2020-10-22得票数 3

回答已采纳

1回答

过拟合DL模型？

tensorflow、keras、deep-learning

我正在尝试建立一个深度学习模型，以便在天气模型数据中挑选出热带气旋。我已经收集了数据，在区域0，1中对其进行归一化，并将其传递给我的早期模型。然后，我将损失和精度曲线绘制为。我得到了奇怪的曲线，因为验证损失在~50个时期后开始增加，这表明过拟合，但验证精度仍在增加。我的模型是否过拟合(大约50个时期)？

浏览 11提问于2019-08-19得票数 0

2回答

测量分类算法的性能

artificial-intelligence、machine-learning、nlp、classification、bayesian

我手头有一个分类问题，我想用机器学习算法来解决这个问题(贝叶斯或马尔可夫，这个问题与要使用的分类器无关)。在给定大量训练实例的情况下，我正在寻找一种方法来衡量实现的分类器的性能，同时考虑到数据过拟合问题。也就是说:给定N1..100个训练样本，如果我在每个样本上运行训练算法，并使用这些完全相同的样本来测量适应度，它可能会陷入数据过拟合问题-the分类器将知道训练实例的确切答案，而没有太多的预测能力，导致适应度结果无用。一个显而易见的解决方案是将手工标记的样本分成训练样本和测试样本；我想了解选择统计上有意义的样本进行训练的方法。白皮书，书籍指针，和PDF非常感谢！

浏览 3提问于2009-01-02得票数 8

回答已采纳

1回答

您应该在哪个阶段绘制验证和学习曲线？

machine-learning

因此，假设我有一个二进制分类问题，我从一个logistic回归模型开始。我快速地评估了模型的准确性(假设我们没有倾斜的数据集)。在此之后，我开始实现其他模型的比较，我开始检查准确性评分，并绘制一条ROC曲线来评估AOC评分。我们可以说，我继续我的logistic回归模型。我不打算微调它和使用网格搜索算法，然后继续选择最佳的超级参数w.r.t的准确性评分。我什么时候才能真正画出学习和验证曲线？我假设我应该把它画在旁边，看看一个更大的参数是如何影响分数的，然后看看我的模型是不合适的还是过拟合的。但是，我不应该更早地绘制学习曲线吗?例如，在我选择从后勤部门开始的第一步。模特？总结一下:画出一

浏览 0提问于2020-09-14得票数 0

2回答

分类决策树中的学习曲线是什么意思？

decision-tree、grid-search

我在分析中使用了分类决策树。首先，我将整个数据分为训练和测试- 60%:40%。然后我在我的训练集上使用GridSearch来获得最佳得分模型(max_depth=7)。然后在交叉验证集和训练集上绘制学习曲线。这是我得到的图表。似乎有两条线是重叠的。那么它告诉我什么呢？在我的模型中没有过度拟合？总的来说，为什么我们在分析中需要学习曲线？ Link to my learning curve image 非常感谢!

浏览 67提问于2019-02-11得票数 1

1回答

迁移学习中的模型微调

deep-learning、data-science、conv-neural-network、resnet、transfer-learning

我正在研究一个深度学习模型，用于“年龄不变的人脸检测”。我开始对数据进行预处理，包括通过MTCNN进行人脸裁剪，图像对比度校正和锐化。然后我开始构建模型架构，我设计了一个定制的顺序CNN模型。训练和验证损失接近1.9，但模型一个时期大约需要8小时。我需要快速的结果，所以我开始尝试迁移学习。我读到一篇论文，说Resnet-18在任务中表现很好，所以我首先使用了Resnet-18。尝试通过改变学习率来调整它，但没有效果。准确率的提高不超过40%。然后我使用了Resnet-50，目前，我正在研究它。我尝试通过手动更改学习率进行微调，尝试使用不同的优化器Adam、SGD。使用学习率衰减。我的模型开始

浏览 17提问于2020-10-02得票数 0

1回答

lstm中的训练和验证损失及准确性

python、nlp

我正在用三个类进行文本分类，在处理过拟合模型后，下面的图像是我添加正则化l2后的模型精度和丢失结果，现在意味着我的模型正在学习？

浏览 5提问于2020-11-26得票数 0

回答已采纳

2回答

当我们可以分类的时候，为什么我们要使用度量学习

machine-learning、classification、metric

到目前为止，我已经阅读了一些被高度引用的指标学习论文。这类论文的总体思想是学习一种映射，使得具有相同标签的映射数据点彼此靠近，而远离其他类的样本。为了评估这些技术，他们报告了KNN分类器在生成的嵌入上的准确性。所以我的问题是，如果我们有一个标记的数据集，并且我们对提高分类任务的准确性感兴趣，为什么我们不在原始数据点上学习分类器。我的意思是，我们可以学习适合(而不是嵌入式)数据点的分类器，而不是找到适合KNN分类器的新嵌入。根据我到目前为止所读到的内容，这种分类器的分类精度比度量学习方法要好得多。是否有研究表明，至少在某些数据集上，度量learning+KNN的性能优于拟合(好的)分类器？

浏览 5提问于2017-07-18得票数 3

2回答

sklearn算法是假设序数整数值为连续特征还是范畴特征？

scikit-learn、categorical-data、one-hot-encoding、ordinal

假设在机器学习问题中，dataset中有几个分类特征。处理分类特性的一种常见方法是一种热编码。然而，在此中，作者将应用于分类特征，然后再进行模型拟合和特征导入。我想问的是，一般而言，sklearn算法是否将OrdinalEncoded特性视为连续的或绝对的特性。如果滑雪板模型将OrdinalEncoded特性视为连续特性，那么它是否是处理分类特性的正确方法？

浏览 9提问于2022-09-06得票数 0

回答已采纳

1回答

为什么验证准确率不能以正常的方式在历次中增加？

python、keras、deep-learning、vgg-net、conv-neural-network

我正在尝试在视网膜图像的数据集中使用imagenet转移学习VGG16模型，但我对获得像this这样的图表感到困惑，我不知道为什么验证精度没有像训练精度一样在历元期间以正常的方式增加，这是过拟合的指标吗？如果是，我如何克服它？

浏览 17提问于2020-04-13得票数 0

2回答

如何在Tensorflow中训练单词嵌入

neural-network、tensorflow、deep-learning、conv-neural-network、word2vec

因此，我更改了这里描述的模型，以执行多类文本分类，而不是二类分类。我的模型即使在应用L2正则化之后也是过拟合的，所以我想使用预先训练好的word2vec模型。但是我对Tensorflow和深度学习非常陌生&不确定从哪里开始。代码：下面是我想要更改的相关代码，以使用谷歌预先训练好的word2vec模型： # Embedding layer with tf.device('/cpu:0'), tf.name_scope("embedding"): W = tf.Variable( tf.r

浏览 0提问于2016-10-08得票数 1

1回答

有没有可能在python中提取经过训练的机器学习模型的公式？

python、c++、machine-learning、model

在我的项目中，我应该使用分类器来根据6个输入值来预测8个类中的一个。我必须比较一个只运行C++代码的设备上的所有监督学习分类器。所以我使用python来教/拟合机器学习模型，但是我需要为每个分类器在C++上运行它找出最终的公式。有什么办法从模型中得到这些公式/代码吗？使用的机器学习算法：支持向量机朴素贝叶斯线性回归线性判别分析决策树 K-最近邻算法 Logistic回归神经网络梯度增强算法随机森林。

浏览 2提问于2018-05-27得票数 3

1回答

组合单独训练的sklearn分类器的最佳方式是什么？

scikit-learn、text-classification、ensemble-learning

场景是这样的:我想结合使用不同的数据训练的三个scikit学习分类器(例如:3个SVM分类器)，但最终的模型(实际预测实例的模型)需要是一个集成/堆叠或一个简单地考虑三个辅助分类器的modelo。假设分类器为SVM1、SVM2和SVM3，以及训练TS1、TS2和TS3的可用子集。SVM1将配备TS1；SVM2将配备TS2；SVM3将配备TS3。最终的模型将预测新的实例，需要是SVM1，SVM2和SVM3的集合。我不想用相同的数据来拟合所有的3个辅助方法。我想将整个训练数据分成子集(TS1，TS2，TS3)，并用不同的子集对每个辅助分类器进行拟合。有什么想法吗？

浏览 23提问于2021-06-27得票数 0

2回答

R中的XGBoost错误("'data‘有类'character’和length...")

r、matrix、machine-learning、xgboost

我在将我的数据拟合到xgboost分类器模型时遇到了困难。当我运行以下命令时： classifier = xgboost(data = as.matrix(training_set[c(4:15, 17:18,20:28)]), label = training_set$posted_ind, nrounds = 10) R Studio告诉我： Error in xgb.DMatrix(data, label = label, missing = missing) : 'data' has class 'character' and length 14

浏览 0提问于2018-09-14得票数 3

2回答

如何检查weka中该模型的数据是否过多

classification、weka

我的原始数据集有500个实例，有10个类，并且存在类不平衡为了减少类不平衡，我使用了过采样技术，我的新数据集有1500个实例和10个类。对于原始数据集，我应用了j48分类器，获得了63%的准确率对于新的样本数据集，我应用了j48分类器，并获得了75%的准确率。我的问题是，我怀疑我的数据对于分类器来说是过度拟合的。如何检查数据是否过拟合以及如何减少过拟合

浏览 0提问于2013-08-22得票数 0

1回答

在训练用于自动语音识别的模型时降低单词错误率

deep-learning、speech-recognition、speech-to-text、loss

我正在训练一个speech to text模型。在第一个时期，WER为0.33，第二个时期的WER仍然相同，但是训练损失增加了，而验证损失减少了。除了降低学习率之外，还能做些什么来使模型学习，至少是过拟合？

浏览 5提问于2020-04-25得票数 1

1回答

建立虚拟变量与拟合模型相匹配

scikit-learn、pandas

我已经建立了一个机器学习分类器，使用Sklearn和熊猫作为我的主要工具。现在，模型的一个输入特性是country (给国家代码(如US)写信)。我用pd.get_dummies函数拟合了一个模型。现在我想对数据进行推断，但是在过去的几个月里，我的数据集中还没有出现一些国家，所以pd.get_dummies函数与拟合的模型不一致。这怎么处理呢？

浏览 0提问于2017-12-18得票数 4

回答已采纳

2回答

列车与试验误差的关系

machine-learning、cnn、svm、variance、bias

我有一些特别的问题，我无法从书本中得到答案。因此，我在这里寻求帮助，如果可能的话，我将非常感谢一个直观的解释。一般来说，神经网络有一个偏差/方差权衡，因此我们需要一个正则化。偏高->欠拟合；方差高-过拟合。为了解决过拟合问题，我们采用正则化方法对权值进行对比。这是一个超参数，并应在培训期间学习，根据我的理解使用交叉验证。因此，数据集被分割成一个训练、验证和测试集。测试集是独立的，在学习过程中模型是看不到的，但是我们有可用的标签。基于该测试集，我们通常会报告假阳性、混淆矩阵、错误分类等统计数据。 ( Q1)这种偏差/方差问题是否也出现在其他算法中，如支持向量机、最小方差分析等？在卷积

浏览 0提问于2018-10-04得票数 0

回答已采纳

1回答

MLPClassifier给出的sklearn.neural_network权重(Python)

python-3.x、scikit-learn

我目前正在研究MLPClassifier的neural_network包的学习。我已经对模型进行了拟合；我想要访问分类器给出的输入特征的权重。我怎么才能接触到它们？提前感谢！

浏览 2提问于2017-07-12得票数 3

回答已采纳

1回答

我应该根据不同的参数绘制我的学习曲线来诊断过拟合/不拟合，还是一个参数足够？

keras、tensorflow、visualization、training

我知道学习曲线是诊断模型过拟合或欠拟合的一个很好的工具。其工作原理简单:根据学习率、模型结构复杂度、训练集大小、训练周期数等具体参数绘制训练/验证损失/精度图。然而，我应该总是绘制许多不同的学习曲线，即取决于这些不同的参数？或者，如果我只根据一个参数绘制一条学习曲线，那就足够了吗？因此，如果我只绘制基于keras (tensorflow 2作为后端) model.fit历史的学习曲线，即取决于训练时代的训练/验证损失，那么它是否足够可靠。

浏览 0提问于2020-05-10得票数 0

2回答

学习曲线-为什么训练的准确性开始这么高，然后突然下降？

python、machine-learning、scikit-learn、classification、logistic-regression

我实现了一个模型，其中我使用Logistic回归作为分类器，我想绘制学习曲线为训练和测试集，以决定下一步做什么，以改进我的模型。为了给你一些信息，为了绘制学习曲线，我定义了一个函数，它采用一个模型，一个预分裂的数据集(训练/测试X和Y数组，NB:使用train_test_split函数)，一个评分函数作为输入，在n个指数间隔的子集上迭代数据集的训练，并返回学习曲线。我的结果如下图所示我想知道，为什么训练的准确性开始这么高，然后突然下降，然后又开始上升，随着训练设置的规模增加？反过来说，为了测试的准确性。我认为非常好的准确性和下降是由于一些噪音，因为小数据集在开始，然后当数据集变得更

浏览 5提问于2016-05-02得票数 3

回答已采纳

2回答

如何知道哪种损失函数适合于图像分类？

deep-learning、cnn、loss-function

我正在实现一个CNN图像分类模型，在那里我正在学习损失函数。有几种类型的损失函数来确定错误。然而，如何找出哪个函数适合于图像的多分类模型呢？

浏览 0提问于2019-08-24得票数 5

1回答

字袋模型:布尔型与TF型

feature-extraction

当我使用传统的特征工程设计文档分类器时，我倾向于(而不是布尔模型)tf模型将文档表示成一个向量，因为直观地布尔模型丢失了每个单词对于将文档分类为特定类的重要性的信息。我的意思是，使用布尔模型将文档表示为向量是指在n维向量空间中，当每个维度表示一个项时，它在n维向量空间中的意义比基于tf的特征提取更少，方法是使用离散值而不是连续值，因为离散(0或1)值可以忽略每个项的权重差异，尽管在使用线性组合进行文档分类时，参数调整过程可能会优化每个项的系数。基于上述原因，我是否有理由认为使用布尔特征来提取文档中的特征向量并不是一个好的选择？我已经知道最近的方法，如表示学习和维数约简，如字嵌入或BERT

浏览 0提问于2019-09-16得票数 3

4回答

验证损失不增加

deep-learning、image-classification、image

我正在试着检查我的二值图像分类模型。我在20个样本上训练它过适应，现在理论上训练损失应该减少，验证损失应该增加。因为模特不应该学任何东西，但我的火车和瓦尔损失都在减少。验证的准确性也遵循一种非随机的模式，在20个样本上过度拟合时，我对性能期望的断言是真的吗?我的训练循环/数据加载过程有问题吗？我怎样才能把它进一步分类呢？ 📷

浏览 0提问于2022-08-15得票数 0

1回答

更多的功能伤害时，不适合？

decision-trees、xgboost

我正在使用XGBClassifier训练二进制分类器(如果我正确理解的话，基本上是增强了决策树)。我有10K的训练例子。我有两个不同的特性集(但它们可能是依赖的)，一个包含26个特性(调用集合A)，另一个包含96个功能(调用集合B)。我试着训练了三个分类器，每个w/ A不同的特征集组合，即A、B和A+B。结果是，只使用A显然比同时使用A和B更好。在这一点上，我认为这可能是过度拟合，因此使用较少的特征实际上避免了过度拟合。在上述训练中使用的树#为100棵。因此，我使用了10倍交叉验证来为每个功能集组合找到最优的树#，它们都超过了100 (比如300-500)。因此，在我看来，这些模型似乎是在学

浏览 0提问于2017-02-27得票数 3

回答已采纳

2回答

使用虚拟值会使模型的性能更好吗？

machine-learning、feature-selection、sklearn-pandas

我看到许多特征工程在对象特征上都有get_dummies步骤。例如，将包含'M‘和'F’的性别列虚拟为两列，并在单热表示中标记它们。为什么我们不在性别栏中直接将'M‘和'F’设为0和1？虚拟方法在分类和回归模型中对机器学习模型都有积极的影响吗？如果是，原因是什么？谢谢。

浏览 2提问于2016-12-02得票数 0

2回答

利用曲线拟合降低数据维数

python、machine-learning、scipy、scikit-learn、dimensionality-reduction

我是一个机器学习的新手，以前从未使用过科学知识。我在做一个项目。作为项目的一部分，我需要训练一种机器学习算法，将一些观察结果分类为不同的类。我对传感器的观测数据进行了处理，得到了一些数据。但是，所处理的数据的问题是，对于不同的观测，它是一个长度不同的向量。这张图片显示了一些数据。绿线是应用高斯滤波器后的原始数据，红线为16次多项式拟合数据。第一行包含3个峰值的数据，第2行包含4个峰值的数据，第3行包含5个峰值的数据。我希望能够将数据分类为不同的类。我目前计划使用多项式的系数作为我的特征向量。第一行很好，但是在峰值数目较多的情况下，多项式产生的拟合很差，可能导致分类不当。我试过使用

浏览 4提问于2015-06-17得票数 1

1回答

在K倍交叉验证中，最终测试集的意义是什么？

statistics、logistic-regression、cross-validation

我正在对我的二元分类问题进行logistic回归，并使用k折叠交叉验证(k=10)对模型进行了验证。但是，我不明白为什么我需要一个最终的测试集:模型的性能不能基于k折叠验证(即，来自10个结果折叠的度量标准)进行评估吗？因为，模型没有真正“看到”测试数据，这不是K折叠的全部要点吗？因此，最终的测试集似乎是多余的，但它似乎也是常见的做法，我想知道为什么？我见过一些关于超参数调优/过拟合等的文章，但是logistic回归并没有太多的超参数可调。那么，最终测试集的意义是什么?我需要它吗?还是从10倍中的每一次提供的性能度量都足以评估模型的性能？

浏览 0提问于2023-04-23得票数 0

1回答

序数回归/分类模型的精度比较

machine-learning、classification、regression、scoring

我正在创建一个模型来预测一个项目是“非常好”，“好”，“坏”还是“非常坏”。在我将训练数据与模型进行拟合后，比较测试中模型的准确性是否重要:模型是否错误地将G分类为VG，而将另一个G分类为VB？一个模型有两个错误分类，一个级别之外，而另一个模型只有一个错误分类，但离三个级别(如VG到VB)，该如何处理？关于什么是共同的方法，有什么准则吗？此外，我现在的想法是，这应该是一个回归问题，但我很高兴得到纠正，如果我应该把这个数据集的标签作为分类问题。

浏览 0提问于2015-06-05得票数 5

回答已采纳