F1分数指标和分类报告sklearn的F1分数值不同_图像分类器的混淆矩阵和F1分数_为什么不同的宏平均计算方法会得到不同的精度、召回率和f1分数 - 腾讯云开发者社区

python、classification、scikit-learn

我使用的"classification_report“来自： from sklearn.metrics import classification_report 为了评价一个分类模型。 📷 我怎么看这份报告？精确、回忆和F1分数的价值是什么？是精度= 56%还是25%，也适用于回忆和F1评分？

浏览 0提问于2021-09-12得票数 3

2回答

如何解读科学分类报告-学习？

classification、metric、binary

📷 如您所见，它是关于使用linearSVC进行二进制分类的。1级的查全率高于0级(+7%)，0级的查全率高于1级(+11%)。你怎么解释这件事？还有另外两个问题：“支持”代表什么？分类报告中的查准率和召回分数与sklearn.metrics.precision_score或recall_score的结果不同。为什么是这样？

浏览 0提问于2019-12-08得票数 30

回答已采纳

1回答

我正在尝试分析我的结果，所以我在sklearn上使用了F1评分指标和分类报告。显示的结果与平均类型无关，完全不同。它一点也不匹配。我的验证数据示例 F1分数0.7666666666666667 但是分类报告的结果是： report precision recall f1-score support 0 0.16 0.57 0.25 7 1 0.40 0.09 0.14 23 accuracy 0.2

浏览 61提问于2020-01-17得票数 2

1回答

关于sklearn分类器评分方法的需要见解

python、scikit-learn

sklearn为我们提供了一个分类器的.score()函数，比如LogisticRegression，DecisionTreeClassifier，etc.Does这个score函数根据其预测的准确性返回分数?如果是，那么准确性可能不是评估模型性能的最佳参数的情况如何? score函数是否根据用例进行自我调整？

浏览 0提问于2021-06-12得票数 0

2回答

宏与微VS加权VS样本F1评分

python、python-3.x、machine-learning、scikit-learn、metrics

在sklearn.metrics.f1_score中，f1分数有一个名为“平均”的参数。宏观、微观、加权和样本意味着什么？请详细说明，因为在文件中没有适当解释。或者简单地回答如下：为什么“样本”是多标签分类的最佳参数？为什么微观对于不平衡的数据集是最好的？加权和宏观有什么区别？

浏览 0提问于2019-04-18得票数 33

回答已采纳

3回答

目的:评估OneVsRestClassifier在GridSearchCV中的每个分类器的性能

python、scikit-learn、multilabel-classification、grid-search

我用OneVsRestClassifier和SVC处理多标签分类， from sklearn.datasets import make_multilabel_classification from sklearn.multiclass import OneVsRestClassifier from sklearn.svm import SVC from sklearn.grid_search import GridSearchCV L=3 X, y = make_multilabel_classification(n_classes=L, n_labels=2,

浏览 5提问于2015-11-18得票数 7

回答已采纳

1回答

在滑雪板的分类报告中，f1是最佳的精度度量吗？

classification、model-evaluations

在由分类_报告提供的sklearn中，我应该看哪个分数来确定我的模型的准确性？ precision recall f1-score support 0 0.70 0.68 0.69 5007 1 0.65 0.54 0.59 2270 2 0.37 0.22 0.28 614 3 0.74 0.30 0.42

浏览 0提问于2017-10-31得票数 1

1回答

F1分数取决于哪个类别被赋予正标签？

python、machine-learning、scikit-learn

f1的分数真的取决于哪个类别被赋予正标签吗？当我使用科学知识学习的f1度量时，它似乎是： >>> from sklearn import metrics as m >>> m.f1_score([0,0,0,1,1,1],[0,0,0,1,1,0]) 0.8 >>> m.f1_score([1,1,1,0,0,0],[1,1,1,0,0,1]) 0.8571428571428571 第一和第二种情况的唯一区别是0和1被交换了。但我得到了不同的答案。这看起来真的很糟糕。这意味着，如果我报告猫/狗分类器的f1分数，这个值取决于猫还是狗是否得

浏览 6提问于2022-01-16得票数 0

回答已采纳

1回答

不同预处理技术的不同F1分数

python、scikit-learn、statistics

我正在使用sklearn's GradientBoostingClassifier构建一个分类模型。对于相同的模型，我尝试了不同的预处理技术:对相同的数据执行StandarScaler, Scale, and Normalizer，但每次得到的f1_scores都不同。对于StandardScaler，它对于Normalizer是最高和最低的。为甚麽呢？有没有其他技术可以让我得到更高的分数？

浏览 0提问于2020-07-10得票数 0

1回答

对高度不平衡的数据进行适当的f1评分

python、machine-learning、scikit-learn、classification、imbalanced-data

我对三种不同的f1计算感到困惑。对于严重不平衡的数据，我应该使用哪种f1评分？我正在研究一个严重不平衡的二进制分类。 ‘f1’ ‘f1_micro’ ‘f1_macro’ ‘f1_weighted’ 另外，我想在balanced_accuracy评分参数中添加balanced_accuracy_score(y_true, y_pred, adjusted=True)。如何将其合并到我的代码中？ from sklearn.model_selection import cross_validate from sklearn.metrics import make_scorer from sklea

浏览 11提问于2021-04-07得票数 0

2回答

GridSearchCV:选定类的性能指标[不平衡数据集]

python、scikit-learn

有没有办法对参数值运行网格搜索，这些参数值针对选定类的分数(例如'f1')进行了优化，而不是所有类的默认分数？编辑的假设是，这样的网格搜索应该返回一组参数，使所选类别的分数最大化(例如，'f1'，‘准确性’，‘召回’)，而不是所有类别的总分数。这样的方法似乎很有用，例如对于高度不平衡的数据集，当试图构建一个在具有少量实例的类上做合理工作的分类器时。使用默认评分方法的GridSearchCV示例(此处:对所有类使用'f1‘)： from __future__ import print_function from sklearn.cross_valid

浏览 0提问于2015-07-30得票数 9

2回答

精度、召回和F1可以是相同的值吗？

machine-learning、scikit-learn、classification、precision、precision-recall

我目前正在处理一个ML分类问题，我正在使用sklearn库的以下导入和相应的代码计算精度、召回和sklearn。 from sklearn.metrics import precision_recall_fscore_support print(precision_recall_fscore_support(y_test, prob_pos, average='weighted')) 结果 0.8806451612903226, 0.8806451612903226, 0.8806451612903226 对于ML分类问题，是否有可能获得所有3种类型的精度、召回和F1值？对

浏览 0提问于2019-01-07得票数 15

回答已采纳

4回答

来自scikits cross_val_score的所有类别的f1分数

python、scikit-learn、cross-validation

我正在使用来自scikit learn(sklearn.cross_validation包)的cross_val_score来评估我的分类器。如果我为scoring参数使用f1，该函数将返回一个班级的F1分数。为了得到平均值，我可以使用f1_weighted，但我找不到如何获得其他班级的F1分数。(查准率和召回率类似) sklearn.metrics中的函数有一个执行此操作的labels参数，但我在文档中找不到类似的内容。有没有办法一次获得所有班级的F1得分，或者至少指定应该使用cross_val_score考虑的班级

浏览 1提问于2016-05-24得票数 5

1回答

切换标签的F1分数

python、scikit-learn、metrics

我想使用sklearn的几个评估分数(NMI，ARI，F1)，使用一些合成数据来评估一种聚类方法。虽然NMI和ARI工作得很好，但在标签被交换的地方，我确实遇到了关于F1分数的问题，例如，真实标签是[0, 0, 0, 1, 1, 1]，而预测标签是[1, 1, 1, 0, 0, 0]。对于集群，这是一个完美的结果，因为两个集群都被正确识别，只有标签被切换:集群1具有标签0，反之亦然。F1分数似乎无法处理此问题，因为我的代码生成的F1分数为0.0。我假设发生这种情况是因为标签不具有相同的名称/编号，但是我不能手动为每个集群切换标签名称，因为这是一种很大的工作方式，特别是对于大型数据集，那么有没有

浏览 17提问于2019-10-26得票数 0

回答已采纳

1回答

F1 -对不平衡数据进行评分

machine-learning、statistics、classification、precision、imbalanced-data

我正在做一个二进制分类任务。我的评估数据不平衡，由appr组成。20%来自class1，80%来自class2。即使我在每个类类型上都有很好的分类准确率，比如class1上的0.602，class2上的0.792，如果我计算f1分数对class1，我得到0.46%，因为假阳性计数很大。如果我在class2上计算它，我得到f1-score为0.84。我的问题是，评估不平衡数据上的分类任务的最佳实践是什么？我可以得到这些F1得分的平均值吗?或者我应该从中选择一个？对于不平衡数据的分类任务的评估，最好的评估指标是什么？顺便说一句，这是我的TP，TN，FN，FP计数； TP: 115 TN: 71

浏览 12提问于2020-03-06得票数 1

回答已采纳

1回答

如何解释近乎完美的准确率和AUC-ROC，但F1为零-分数，精度和召回率

machine-learning、classification、roc、precision-recall

我正在使用python scikit-learn训练ML逻辑分类器来对两个类进行分类。他们处于极不平衡的数据中(大约14300:1)。我得到了几乎100%的准确率和ROC-AUC，但准确率，召回率和f1分数为0。我理解在非常不平衡的数据中，准确性通常是没有用的，但为什么ROC-AUC度量也接近完美？ from sklearn.metrics import roc_curve, auc # Get ROC y_score = classifierUsed2.decision_function(X_test) false_positive_rate, true_positive_rate, t

浏览 0提问于2016-01-10得票数 22

回答已采纳

1回答

低F1-前几个Fold的分数

machine-learning、random-forest、cross-validation、k-fold

我使用随机森林创建了一个分类模型。为了验证模型，我使用K-折叠法进行10次分割，并通过f1-score测量模型性能。当我这样做的时候，我的前几个折叠的F1得分非常低，而其余折叠的F1得分非常高。我期待在每个分裂的分数相同的范围。代码： from sklearn.ensemble.forest import RandomForestClassifier from sklearn.model_selection._split import KFold kf = KFold(n_splits=20,random_state=41) f1list = [] for train_index,

浏览 1提问于2019-10-08得票数 0

3回答

对于不平衡的数据，精度低于f1分。

classification、accuracy、confusion-matrix、f1score

对于二进制分类，我有一个具有55%负标签和45%正标签的数据集。分类器的分类结果表明，该分类器的分类精度低于F1分。这是否意味着该模型对消极实例的学习要好于正面实例？这甚至是有意义的，有准确性低于F1的分数？

浏览 0提问于2020-07-13得票数 6

1回答

分类报告结果

python、scikit-learn、classification

我认为我的参数有一些问题，因为我得到了不同的结果。由于代码量很大，我无法复制和粘贴所有代码，只能复制和粘贴相关的部分。我使用不同的模型来预测一个帐户是否是假的。以下是模型的一个示例： rf = Pipeline([ ('rfCV',FeaturesSelection.countVect), ('rf_clf',RandomForestClassifier(n_estimators=200,n_jobs=3)) ]) rf.fit(DataPreparation.train_acc['Acc

浏览 14提问于2020-12-25得票数 0

回答已采纳

1回答

什么是机器学习中的“平均”f1分数？

performance、machine-learning、classification、kaggle

我知道f1分数，它使用精确度和召回率。但是，mean f1 score中的“mean”是什么？当我们使用它的时候，如何计算“均值”？编辑以明确解释我的问题:我知道f1分数是准确率和召回率的调和平均值。并且在计算f1得分时，需要多个分类结果来计算准确率和召回率。例如，如果我们有一个由1000个实例组成的数据集，我们可以得到1000个分类结果。然后我们把它放到列联表中，这样我们就可以计算f1分数了。现在，这是我与“平均”f1分数混淆的点。我们从列联表中计算f1得分，但是什么是“均值”？只有我可以计算f1分数，那么什么是“平均”，如何计算“平均”f1分数？

浏览 19提问于2017-08-10得票数 1

回答已采纳

1回答

为什么我的分类精度对训练和测试数据都很高？

machine-learning、python、classification、decision-trees

我有一个有10个特征和一个二进制分类目标的数据集。我用决策树分类器测试了这个数据集。我做了一些基本检查，比如缺少值，但是数据看起来很干净。我对训练和测试数据的分类准确率很高，看起来很可疑。我想知道我是否做错了什么，或者有没有办法解释为什么准确度太高？有人能在这里给我建议吗？ import pandas as pd from sklearn.model_selection import KFold, StratifiedKFold, RepeatedKFold, RepeatedStratifiedKFold, cross_validate, train_test_split from skl

浏览 0提问于2021-04-05得票数 0

1回答

如何防止Keras总是预测我的数据的潜在分布？

deep-learning、keras、data-science

我正在一个非常不平衡的数据集上训练一个深度CNN，用于一个二进制分类问题。我有90%0和10%1。为了惩罚1的错误分类，我使用了一个由sklearn的compute_class_weight()确定的class_weight。在传递给fit_generator()的验证元组中，我使用了一个由sklearn的compute_sample_weight()计算的sample_weight。网络似乎学习得很好，但在每个时代之后，验证准确率继续保持在90%或10%。考虑到我已经采取的步骤，我如何在Keras中解决这个数据不平衡问题？ Fit_generator图片：日志输出图片：

浏览 0提问于2017-11-07得票数 0

3回答

如何解释scikit的学习混淆矩阵和分类报告？

machine-learning、nlp、scikit-learn、svm、confusion-matrix

我有一个情感分析任务，对于这个，我的观点有5个类别(very neg，neg，neu，pos，very pos)，从1到5。所以我做了如下分类： from sklearn.feature_extraction.text import TfidfVectorizer import numpy as np tfidf_vect= TfidfVectorizer(use_idf=True, smooth_idf=True, sublinear_tf=False, ngram_range=(2,2)) from sklearn.cross_val

浏览 1提问于2015-06-10得票数 33

回答已采纳

1回答

使用朴素贝叶斯分类器的测试集上的F1随训练集大小的增加而减小。为什么？

naive-bayes-classifier

我用一个非常小的数据集完成了一个简单的朴素贝叶斯分类任务。当训练集的大小从100个数据点增加到300个数据点时，测试集上的F1分数就会减少。但是为什么呢？会不会太合适了？我首先应该检查哪些地方来解释这种行为？

浏览 0提问于2017-01-26得票数 3

1回答

交叉验证返回分数超过1.0我该怎么做？

python、scikit-learn、cross-validation

首先，我想说我在发帖之前搜索了很多，但是没有发现任何超过1.0 (100%)的得分。所以首先我使用GridSearchCV来选择我的模型，但是我没有使用伽马参数，因为GridSearch被卡住了。这是我的代码： from sklearn.svm import SVR from sklearn.model_selection import GridSearchCV svr = SVR() param_grid = {'kernel':['linear','rbf','poly','sigmoid'], '

浏览 1提问于2016-11-20得票数 4

回答已采纳

1回答

Talos hyperparametr search:如何在评估步骤中设置度量

keras、talos

我想了解一下talos中的超参数搜索。具体地说，就是模型的评估。我正在浏览这个示例笔记本https://nbviewer.jupyter.org/github/autonomio/talos/blob/master/examples/Hyperparameter%20Optimization%20with%20Keras%20for%20the%20Iris%20Prediction.ipynb#seven 不，我的问题是:在评估(7)中，我如何设置特定的评估指标？例如，分类问题的F1分数。他们来自凯拉斯还是塔罗斯？如果不传递参数，默认值是什么？我在talos文档中找不到它。我是不是忽略了什

浏览 13提问于2019-01-23得票数 0

回答已采纳

4回答

如何计算精确度、召回率、准确率和多类案例的f1-score？

python、machine-learning、nlp、artificial-intelligence、scikit-learn

我正在处理一个情绪分析问题，数据看起来是这样的： label instances 5 1190 4 838 3 239 1 204 2 127 因此，我的数据是不平衡的，因为1190个instances被标记为5。对于分类，我使用的是scikit的。问题是我不知道如何以正确的方式平衡我的数据，以便准确地计算多类情况下的精确度、召回率、准确率和F1分数。因此，我尝试了以下方法：首先： wclf = SVC(kernel='linear', C= 1, class_weight={1: 10})

浏览 231提问于2015-07-15得票数 132

回答已采纳

1回答

为什么我手动计算时的f1_scores与通过sklearn.metrics输出的不同

python、artificial-intelligence

嗨，我是python和AI的新手，我试图解释我的f1_scores，我意识到如果我基于混淆矩阵使用f1 = 2TP / (2TP + FP + FN)手动计算我的F1分数，它与sklearn.metrics返回给我的结果是不同的。这是我的代码 dataset = pd.read_csv('diabetes-data.csv') zero_not_accepted = ['Glucose', 'BloodPressure', 'SkinThickness', 'BMI', 'Insulin']

浏览 97提问于2021-07-04得票数 0

回答已采纳

1回答

Catboost的结果没有任何意义

machine-learning、scikit-learn、classification、catboost

我在一个不平衡的数据集上运行CatboostClassifier，二进制分类，优化日志丢失和度量F1评分。得到的图在F1:use_weights = True、F1:use_weights = False上显示了不同的结果，并给出了训练预测和验证预测的不同结果。 params = { 'iterations':500, 'learning_rate':0.2, 'eval_metric': 'F1', 'loss_function': 'Logloss',

浏览 7提问于2022-06-04得票数 -1

回答已采纳

1回答

如何在训练集上获得低F1评分和高AUC？

machine-learning、classification、xgboost、imbalanced-data

我目前正在处理一个非常不平衡的数据集： 2 400万笔交易(数据行) 30 000宗欺诈交易(占交易总额的0.1%) 我使用XGBoost作为模型来预测交易是否具有欺骗性。在通过optuna调整了一些超参数之后，我收到了这样的结果。 F1训练数据评分: 0.5881226277372263 验证数据的F1评分: 0.8699220352892901 训练数据得分: 0.9991431591607794 验证数据得分: 0.9254554224474641 虽然我的训练数据的F1分数很高，但它的分数却很高，而我的训练数据的分数却很高。我想知道我的模型或数据有什么问题吗？我是否过度适应，这些结果是

浏览 0提问于2023-05-22得票数 0

1回答

HyperOpt:基于精度或f1评分的最佳建模方法

data、data-science-model、hyperparameter-tuning

我已经使用了2天的超级选择，我试图建立逻辑回归模型，使用超级选择和选择参数的最佳组合，根据他们的f1评分。然而，无论在哪里，他们都提到了根据损失分数来选择最好的模式。如何使用精度或f1分数来代替？谢谢!

浏览 0提问于2022-03-31得票数 2

3回答

如何从单个输入值获取分类报告

python、machine-learning、scikit-learn、nlp

我用NLP来分类我的数据，我已经训练了我的数据，现在我想知道一个输入值的分数。我的数据包含了服装和时尚的东西，它应该返回一个属于它的类别。我想从一个输入值中检查分类分数。所以我就这样做： bow4 = bow_transformer.transform([message4]) tfidf4 = tfidf_transformer.transform(bow4) predicted = spam_detect_model.predict(tfidf4) from sklearn.metrics import classification_report print (classification

浏览 0提问于2019-12-20得票数 3

回答已采纳

1回答

Decision_function用于XGBoost的SKLearn包装器

machine-learning、scikit-learn、xgboost

对于model.predict_proba(X)[:,0]，我得到的结果与SKLearn中的普通Grad决策树分类器的model.decision_function(X)不同，所以我知道这是不一样的。我要模型的分数。绘制ROC曲线等，如何利用XGBoost包装器获得SKLearn分类器的决策函数？为什么predict_proba和分数不同？

浏览 0提问于2018-04-11得票数 0

2回答

在有监督的多类分类中，为什么使用宏观F1分数而不是平衡精度？

machine-learning、supervised-learning

假设我有一个三类问题，我想构建一个可以根据一组特征区分类的分类器。我想根据模型区分这3个类的能力来评估它。从我的阅读来看，宏观F1分数似乎是用于评估多类问题分类器的常用指标，其中为每个类计算F1分数，然后将这些F1分数的未加权平均值用作macro F1 score。在其他文献中，我见过用于多类问题的平衡精度，其中计算每一类的精度，然后将这些精度的未加权平均值用作balanced accuracy。为什么宏观F1得分比平衡准确性更受青睐？平衡精度不是更容易解释吗，平衡精度< 0.5告诉我们模型的表现比随机更差？我们如何以与平衡准确率相同的方式来解释F1分数--什么阈值表明分类器比

浏览 4提问于2016-03-09得票数 3

1回答

在不平衡数据集上解释AUC、准确性和f1评分

python、scikit-learn、tensorflow2.0、multiclass-classification、auc

在数据集不平衡的情况下，我试图了解AUC是一个比分类精度更好的度量标准。假设dataset包含3个类的1000个示例，如下所示： a = [[1.0, 0, 0]]*950 + [[0, 1.0, 0]]*30 + [[0, 0, 1.0]]*20 显然，这些数据是不平衡的。一个天真的策略是预测属于第一类的每一个点。假设我们有一个具有以下预测的分类器： b = [[0.7, 0.1, 0.2]]*1000 对于列表a中的真实标签和列表b中的预测，分类精度为0.95。因此，人们会认为模型在分类任务上确实做得很好，但这并不是因为模型预测了一个类中的每一个点。因此，建议采用AUC度量来评估

浏览 2提问于2020-06-19得票数 1

回答已采纳

1回答

cross_val_score与StratifiedKFold的F分差

python、scikit-learn、random-forest、cross-validation、imbalanced-data

我想对不平衡的数据使用随机森林分类器，其中X是表示特性的np.array，y是表示标签的np.array (带有90% 0-值和10% 1-值的标签)。由于我不确定如何在交叉验证中进行分层，如果这有区别，我也会手动地使用StratifiedKFold进行交叉验证。我希望得到的结果不一样，但有些相似。由于情况并非如此，我想我错误地使用了一种方法，但我不明白是哪一种方法。这是代码 from sklearn.ensemble import RandomForestClassifier from sklearn.model_selection import StratifiedKFold, cross

浏览 0提问于2020-02-17得票数 0

回答已采纳

1回答

如何在Optuna中优化多个指标

python、machine-learning、hyperparameters、optuna

如何在Optuna的objective函数中同时优化多个指标。例如，我正在训练一个LGBM分类器，希望为所有常见的分类指标找到最佳的超参数集，如F1、精确度、召回率、准确度、AUC等。 def objective(trial): # Train gbm = lgb.train(param, dtrain) preds = gbm.predict(X_test) pred_labels = np.rint(preds) # Calculate metrics accuracy = sklearn.metrics.accuracy_score(y

浏览 85提问于2021-09-06得票数 1

回答已采纳

4回答

classification_report中的宏平均和加权平均意义

classification、accuracy、class-imbalance

我使用from sklearn.metrics import classification_report中的“分类报告”来评估不平衡的二进制分类 Classification Report : precision recall f1-score support 0 1.00 1.00 1.00 28432 1 0.02 0.02 0.02 49 accuracy

浏览 0提问于2020-01-04得票数 27

1回答

在高度不平衡的数据中混淆F1分数和AUC分数，同时使用5倍交叉验证

python、machine-learning、scikit-learn、classification

我一直在尝试使用5折交叉验证来对高度不平衡的数据进行分类。我的样本量是：总样本: 12237899 阳性样本: 1064份(占总数的0.01%) 我也想避免数据泄露。然而，我得到了相当低的平均精度分数和F-1分数。我使用加权逻辑回归来帮助我处理不平衡的数据，因为SMOTE在存在极不平衡的数据时不能很好地工作。另外，我在sklearn库中看到了F-1分数的几个选项。例如: f1 score有一个参数:average{‘微’，‘宏’，‘样本’，‘加权’，‘二进制’}。不确定我应该使用哪一个？另外，它与cross_val_score(clf，X，y，cv=5，scoring='f1'

浏览 0提问于2021-04-03得票数 1

1回答

回归分类报告(sklearn)

python、scikit-learn

当您试图预测某事物是否属于某个类时，您可以使用sklearn的分类报告。但是，这只在类是绝对的情况下才能起作用。当您尝试用支持向量回归机或线性回归来预测值时，有没有人碰巧知道如何使用sklearn的分类报告？我得到以下错误： ValueError: Unknown label type: (123 13.409091 760 16.593333 748 13.646667 334 13.828571) 在尝试时： print("Classification report: ", classification_report(y_test, y_

浏览 1提问于2018-08-01得票数 7

1回答

classification_report和precision_score之间的关系是什么？

python、scikit-learn、classification

我想用classification_report、accuracy_score、precision_score、recall_score和f1_score评价指标来评价我的机器学习模型。 classification_report有正常输出，但我的precision_score报告了一个错误。 from sklearn.metrics import accuracy_score from sklearn.metrics import precision_score from sklearn.metrics import recall_score from sklearn.

浏览 0提问于2021-11-25得票数 0

回答已采纳

1回答

scikit 0.14多标签指标

python、scikit-learn

我刚刚安装了scikit 0.14，这样我就可以探索多标签指标的改进。我使用hamming损失度量和分类报告获得了一些积极的结果，但无法使混淆矩阵工作。同样在分类报告中，我无法传递标签数组并在报告中打印标签。下面是代码。是我做错了什么，还是它还在开发中？ import numpy as np import pandas as pd import random from sklearn import datasets from sklearn.pipeline import Pipeline from sklearn.multiclass import OneVsOneClassifier f

浏览 4提问于2013-07-07得票数 2

2回答

用K-折叠训练决策树--这是正确的方法吗？

python、pandas、validation、scikit-learn

我使用了两种具有相同SKlearn决策树的方法，一种使用验证集，另一种使用K折叠。然而，我不确定我是否真的通过使用KFold实现了什么。从技术上讲，交叉验证确实显示了5%的准确性，但我不确定这是否仅仅是这个特定数据的谱性扭曲了结果。对于KFold的实现，我首先使用以下方法将培训集分割成若干段： f = KFold(n_splits=8) f.get_n_splits(data) 然后从其中获取数据帧 y_train, y_test = y.iloc[train_index], y.iloc[test_index] 在一个循环中，正如许多在线教程中所看到的那样，如何做到这一点。然而，这里出

浏览 1提问于2018-01-13得票数 0

回答已采纳

1回答

在Cohen Kappa中使用了哪些注释器来解决分类问题？

classification、scikit-learn、binary

我正在使用Logistic回归、支持向量机、决策树、随机森林和朴素贝叶斯等算法处理一个分类问题。我的数据包括二进制类分类，即Fire(1)或No Fire(0)。由于数据不平衡，科恩·卡帕被推荐用于模型性能评价。我正在使用科学工具包-学习sklearn.metrics.cohen_kappa_score来计算科恩卡帕的分数。要计算值，它需要以下输入 from sklearn.metrics import cohen_kappa_score cohen_score = cohen_kappa_score(y_test, predictions) print(cohen_score) 因此，它采

浏览 0提问于2020-04-03得票数 0

回答已采纳

1回答

在pytorch ignite自定义度量中使用f1 score sklearn

python、scikit-learn、deep-learning、pytorch、pytorch-ignite

我想在PyTorch-ignite的自定义度量中使用sklearn的f1_score。我找不到一个好的解决方案。虽然在PyTorch-ignite的官方网站上，有一个解决方案 precision = Precision(average=False) recall = Recall(average=False) F1 = Fbeta(beta=1.0, average=False, precision=precision, recall=recall) ，如果你需要有一个f1分数微观/宏观/加权，你不能使用这个例子。如何在sklearn库中使用自定义指标？

浏览 5提问于2021-06-28得票数 0

1回答

在培训期间报告其他指标评估简单变革者

python、machine-learning、text-classification、bert-language-model、simpletransformers

我正在使用simpletransformer库的bert分类器(bert-base-uncased)在大量数据上训练文本分类模型。Simpletransformer默认情况下会返回mcc和eval_loss，用于在训练和测试(评估)阶段进行评估。我能够为测试阶段设置额外的指标，比如acc、f1等(通过向eval_model函数发送额外的指标)，但我不知道如何告诉simpletransformer在训练阶段也报告这些指标？有没有可能用train_model函数做同样的事情？值得一提的是，eval_during_training选项是True。它为每个检查点打印训练的mcc和eval_loss

浏览 23提问于2021-11-16得票数 1

1回答

如何使用sklearn.metrics计算多标签分类任务的微观/宏观度量？

python、scikit-learn、precision-recall

我有一个多标签分类器产生的结果，我想要计算微观和宏观精度，回忆和F1分数使用sklearn.metrics在python，但不太清楚如何。我有两个二进制稀疏矩阵，dataOUT和dataGT，它们分别代表同一数据集的分类结果和基本真理。这两个矩阵都是nLabels X nSamples大小的。每个样本都可以用一个或多个标签标记，所以如果分类器用dataOUT[i,j]标记jth样本，则为0，则为0。对于任何给定的类i，我可以通过从dataOUT中提取i第四行来轻松地计算规则精度、召回和F-得分，而dataGT可以将这些数据提供给sklearn.metrics.precision_recal

浏览 3提问于2015-11-02得票数 2

回答已采纳

1回答

用滑雪板计算宏f1分数

python、scikit-learn、metrics

我正在使用sklearn计算macro f1分数，我怀疑代码中是否有任何错误。下面是一个示例(忽略标签0 )： from sklearn.metrics import f1_score, precision_recall_fscore_support y_true = [1, 1, 1, 1, 1, 2, 2, 2, 2, 3, 3, 3, 4, 4] y_pred = [1, 1, 1, 0, 0, 2, 2, 3, 3, 3, 4, 3, 4, 3] p_macro, r_macro, f_macro, support_macro \ = precision_recall_

浏览 4提问于2017-04-15得票数 0

回答已采纳

1回答

将记分器对象用于分类器评分方法

machine-learning、scikit-learn

我已经编写了我的自定义记分器对象，这对于我的问题是必要的，我将其称为"p_value_scoring_object“。对于函数sklearn.cross_validation.cross_val_score，其中一个参数是“scorer”，它允许使用这个记分器对象。但是，此选项不适用于分类器的评分方法。sklearn只是缺少这个功能，还是有办法绕过它？ from sklearn.datasets import load_iris from sklearn.cross_validation import cross_val_score from sklearn.tree import

浏览 5提问于2016-07-27得票数 1

7回答