为什么我的SpaCy v3记分器在精度、召回率和f1方面都恢复为0？

machine-learning、class-imbalance、f1score

我在这个网站上读到过，如果数据集不平衡，如果你想在回忆和进进之间寻求平衡的话，建议使用F1评分。请您解释一下F1如何在不平衡的数据集方面有用吗？

浏览 0提问于2021-12-14得票数 5

1回答

关于提高SpaCy 2.2.3中NER召回率的建议

spacy

我正在寻找关于在SpaCy的自定义NER培训中提高召回率的建议(可能是通过超参数或不同的优化器)。我目前正在训练SpaCy 2.2.3，以提取美国股票报价器作为自定义实体类型。我已经训练了大约40K个带有标记的新闻故事，这些新闻故事中标识了报价器，并尝试了使用默认超参数的默认Adam优化器。在测试集上，训练了30个时期(尽管我发现它们也与20个时期相似)后的统计数据如下: f1: 0.8024804229439122精度: 0.9800634345265066召回: 0.6793798936575954 我对精确度很满意，但我正在寻找提高召回率的建议。对调整默认的超参数、优化器或训练方

浏览 15提问于2019-12-21得票数 0

1回答

在尝试使用网格搜索交叉验证优化分类器模型时，我的f1分数降至0

python、classification

我已经运行了RandomForestClassifier和MLPClassifier模型，我收到的准确率和f1得分分别为83%和39%，而不是86%和34%。我的数据集不平衡，一个类中有523个，另一个类中有91个，它有22个特征。当我尝试使用网格搜索交叉验证优化我的模型时，我对两个模型的准确率都略有提高，但我的f1分数下降到0%，这可能是什么原因？

浏览 3提问于2021-03-12得票数 0

2回答

如何解读科学分类报告-学习？

classification、metric、binary

📷 如您所见，它是关于使用linearSVC进行二进制分类的。1级的查全率高于0级(+7%)，0级的查全率高于1级(+11%)。你怎么解释这件事？还有另外两个问题：“支持”代表什么？分类报告中的查准率和召回分数与sklearn.metrics.precision_score或recall_score的结果不同。为什么是这样？

浏览 0提问于2019-12-08得票数 30

回答已采纳

1回答

如何处理平均精度边缘的情况？

math、machine-learning、computer-vision、data-science

我正在为一个计算机视觉模型实现一个平均平均精度(mAP)度量，该模型输出多个类的边界框，我需要帮助理解如何处理一些边缘情况。由于我的问题的性质，这是一个计算机视觉问题可以忽略不计。我清楚地知道mAP = true_positives / (true_positives + false_positives)，但是当true_positives == false_positives == 0发生时会发生什么呢？即。如果输出不能预测任何事情。我目前的假设是，如果有算法不能预测的注解，mAP应该是0，否则，如果一开始没有注释，它应该是1，但这似乎有点违背直觉，因为这将进入回忆领域。示例1： T

浏览 2提问于2019-07-12得票数 1

回答已采纳

2回答

什么是坏的，好的，好的和优秀的F1测量范围？

performance、machine-learning、precision、measurement、precision-recall

我知道F1-measure是精度和召回率的调和平均值。但是，什么值定义了F1度量的好坏？我似乎找不到任何参考资料(谷歌或学术)来回答我的问题。

浏览 0提问于2016-04-19得票数 29

2回答

怎样才能解释为什么F1评分要高得多呢？

machine-learning、neural-network、deep-learning、classification、keras

我正在构建一个二进制分类器，它使用Keras对数值数据进行分类。我的数据集中有6992个数据点。测试集占数据的30%。验证集占训练集的30%。在评估模型时，我得到以下值： recall: 0.8914240755310779 precision: 0.7006802721088435 f1_score: 0.7846260387811634 accuracy_score: 0.7035271816800843 为什么accuracy_score比F1的分数低10%？下面是我用来评估模型的代码： print('recall: ', recall_score(Y_te

浏览 0提问于2019-01-18得票数 4

回答已采纳

1回答

ROC曲线与最优阈值

classification

我正在做一个练习问题，预测一个二元结果。我绘制了一条ROC曲线，找到了未来预测观测的最佳阈值百分比为1，我发现这个阈值总是与我原始数据中等于1的观测百分比相匹配。对此有什么概念上的解释吗？

浏览 0提问于2019-08-11得票数 1

回答已采纳

2回答

不支持未知- f1分数

python、machine-learning、scikit-learn

我想用32个预测的蒙版图像和32个真实的蒙版图像做f1评分。我的数据有以下特点： predicted.shape [32,512,512] true.shape [32,512,512] type_of_target(predicted) Unknown type_of_target(true) Unknown type_of_target(predicted[0]) Continuous-multioutput type_of_target(true[0]) Continuous-multioutput 当我运行这一行f1_score(true，

浏览 0提问于2020-04-26得票数 1

1回答

spacy、named-entity-recognition、precision-recall、spacy-3

我有以下代码(从SpaCy v2迁移)，我想在其中计算给定模型的精度、召回率和F1得分： nlp = spacy.load("my_model") scorer = Scorer(nlp) examples = [] for text, annotations in TEST_DATA: examples.append(Example.from_dict(nlp.make_doc(text), annotations)) results = scorer.score(examples) print( "Precision {:0.4f}\tRecall

浏览 68提问于2021-08-11得票数 0

回答已采纳

2回答

为什么科学学习说F1分数是模糊的，FN大于0？

python、machine-learning、statistics、scikit-learn

我运行了一个python程序，它调用sklearn.metrics的方法来计算精度和F1分数。 /xxx/py2-scikit-learn/0.15.2-comp6/lib/python2.6/site-packages/sklearn/metr\ ics/metrics.py:1771: UndefinedMetricWarning: Precision is ill-defined and being set to 0.0 due to no predicted samples. 'precision', 'predicted', average, wa

浏览 4提问于2016-01-13得票数 48

1回答

机器学习分类结果好得令人难以置信？

python、pandas、machine-learning、scikit-learn、classification

很抱歉所有的文字，但我认为这个项目的背景可能会有所帮助：我一直在做一个二进制分类项目。原始数据集由大约28,000个类0和650个类1组成，因此它是非常不平衡的。我得到了一个欠采样和过采样的数据集，每个类有5000个(第一类实例被简单地复制了9次)。在对此进行模型训练并获得低于平均水平的结果(AUC值约为.85，但需要更好)后，我开始怀疑这些采样技术是否真的是一个好主意，因此我再次取出了原始的高度不平衡的数据集。我把它直接插入到一个默认的GradientBoostClassifier中，在80%的数据上训练它，我立即得到了类似这样的东西： Accuracy: 0.997367035282 A

浏览 19提问于2016-08-17得票数 0

1回答

Rattle R package:评估logistic回归模型和决策树模型的模型性能的最佳指标是什么？

r、decision-tree、logistic-regression、rattle

我有一个数据集需要在两个模型中进行评估:逻辑回归和决策树。评估这两个模型性能的最佳指标是什么？

浏览 3提问于2015-03-10得票数 0

3回答

计算平均F1分数的正确方法是什么？

parameter

我有一套10个实验，计算精度，回忆和F1评分为每个实验。现在，平均查准率和平均召回率很容易计算。我对F1的平均分数有些困惑。关于如何计算平均F1分数，有两种方法：用10个实验中的每一个实验的f1分数来计算它们的平均值。取平均精度和平均召回率，然后使用公式f1 = 2*p*r/(p+r)计算f1分数。我找不到任何有力的理由来支持这些论点。我能找到的最接近的文档是：https://www.kaggle.com/wiki/MeanFScore 有人能用一些参考(如果可能的话)来解释哪些方法是正确的，为什么？编辑:其中一位成员建议使用这源。不过，我仍然怀疑消息来源的可靠性。我在他们的研究出版

浏览 0提问于2017-01-08得票数 8

回答已采纳

1回答

多标签分类的性能评价

performance、machine-learning、classification

因此，为了评估多标签分类算法(每个实例都与多个标签相关联)，我同时考虑了准确性和F1-Measure。拥有： Accuracy = #Intersection(suggestions,correct_labels) / #Union(suggestions,correct_labels) F1 Measure = 2 * (P * R) / (P + R) 哪种方法更好?为什么？在什么情况下，我应该选择其中之一？

浏览 2提问于2013-12-04得票数 5

2回答

什么是f1-score，它的值表示什么？

machine-learning、scikit-learn

sklearn上有一个评估指标，它是f1- score (也存在f-beta score)。我知道如何使用它，但我不太明白它代表什么。当它是大或小时，它表示什么。如果我们把公式放在一边，我应该从f分值中理解什么？

浏览 3提问于2017-08-30得票数 6

回答已采纳

5回答

有没有办法用spaCy的NER来计算每种实体类型的指标？

python、entity、metrics、spacy、named-entity-recognition

在spaCy的NER模型中，有没有一种方法来提取每个实体类型的指标(精确度、召回率、f1分数)？看起来像这样的东西： precision recall f1-score support B-LOC 0.810 0.784 0.797 1084 I-LOC 0.690 0.637 0.662 325 B-MISC 0.731 0.569 0.640 339 I-MISC 0.699 0.589 0.639

浏览 0提问于2018-10-17得票数 12

1回答

精确召回曲线下面积

classification、class-imbalance、auc

对于我使用AutoML构建的分类器，我得到了以下精确召回曲线。大多数Precisio回忆曲线倾向于从(0，1)走向(1,0)。但我的恰恰相反。但我觉得，和中华民国的曲线一样，得到一条(一，一)的PR曲线其实是好的，这种理解是不是错了？如果你得到这样的PR曲线，你会如何解释结果？这是个好模特吗？如果它不是一个好的模式，为什么？我需要更正我的数据吗？注:数据集用于欺诈检测，因此正类和负类是不平衡的。 📷

浏览 0提问于2022-04-07得票数 3

1回答

查准率和召回率之间是如何成反比关系的？

data-mining、confusion-matrix、classifier

我知道什么？首先， Precision= \frac{TP}{TP+FP} Recall=\frac{TP}{TP+FN} 什么书说的？一种宣称每一张记录都具有高召回率但精度低的模型。据我所知，如果预测的阳性值很高，精度就会很低。但怎样才能回忆起高，如果预测积极是高的。一种为训练集中的一个阳性记录指定一个阳性类的模型具有很高的查准率，但召回率很低。我无法正确理解精确性与回忆之间是怎样的反比关系。这是我找到的一个文档，但是我也无法从这个文档中理解它。 https://www.creighton.edu/fileadmin/user/HSL/docs/ref/Searching_-_召回

浏览 0提问于2021-07-02得票数 0

回答已采纳

1回答

了解二进制分类器的精度和召回结果

python、machine-learning、precision-recall

我知道机器学习中的精确度和召回率之间的区别。一种是对假阳性进行优化，另一种是对假阴性进行优化。在统计学中，它被称为对类型I或类型II错误的优化。然而，我很困惑在什么情况下可以得到完全相反的精确度和召回率？比如精度=1和Recall=0？让我重复一下： precision = true positives / (true positives + false positives) recall = true positives / (true positives + false negatives) 这是混淆矩阵 predicted (+) (-)

浏览 3提问于2017-06-05得票数 1

1回答

sk.learn average_precision_score

scikit-learn、average-precision

sklearn函数中计算的平均精度分数遵循下图所示的公式。 AP = Σ(Rn - Rn-1)Pn *The index value of the sumation is n. Please refer to the attached image for a clear version of the formula 我正在努力完全理解这个函数背后的数学原理。我特别好奇公式中的第n个阈值是如何计算的。阈值的数量是否等于样本的数量？

浏览 3提问于2021-07-20得票数 0

1回答

如何使用CNN (Keras)计算多类的一对一ROC

python、keras、conv-neural-network、roc、auc

我想考10个班的ROC。我使用了CNN模型(keras)。我可以得到一条vs rest曲线，但我想要一对一。以下是我的代码片段。 model.compile(optimizer=keras.optimizers.Adam(0.001), loss='categorical_crossentropy', metrics=['acc']) from keras.callbacks import History history = History() model.fit_generator(generator=tr

浏览 74提问于2020-12-03得票数 0

1回答

回忆在两类分类任务中有意义吗？

machine-learning、classification、precision-recall

我知道Recall= TP/ (TP+FN) 假设我考虑分类器的不同上下文的召回值。在一个上下文中，我将classA作为我的积极类，将classB作为我的负面类。在另一个上下文中，我将classA作为我的负面类，将classB作为我的正面类。在这些上下文中，让R1和R2值成为回调值 R1=TP1/(TP1+FN1) R2=TP2/(TP2+FN2) But TP2=FN1 and FN2=TP1 So R2=FN1/(TP1+FN1) So R1+R2=1 这个论点有什么问题吗?我觉得有问题，因为我看到分类器正在使用recall进行评估。同样，如果我被要求计算分类器的召回率，它是R1还是R

浏览 0提问于2016-11-08得票数 0

1回答

用交叉验证计算特异性

machine-learning、scikit-learn、cross-validation、make-scorer

我想用交叉验证来计算特异性。我找到了计算精度，真的，F1分数和精度的代码。但我找不到特异性。例如，F1分数的代码类似于： cross_val_score(SVC, X, y, scoring="f1", cv = 7) 或者说精确性就像： cross_val_score(SVC, X, y, scoring="precision", cv = 7)

浏览 1提问于2020-10-26得票数 2

回答已采纳

1回答

如何创建名称实体识别，并从精确性和召回性的角度评价其性能？

machine-learning、nlp、weka、stanford-nlp、opennlp

我正在研究从电影评论数据集中识别方面(显式和隐式方面)。在这里，可以是演员，导演，制作公司，音乐，情节，电影类型等。尽管我搜索了很多，我已经认识到我需要一个NER (名称实体识别)的电影评论数据集。不幸的是，我的数据集没有NER可用。我的问题是：我如何评估我的“电影纳”的精确性，召回和F1测量？为此，我应该使用什么工具？

浏览 3提问于2016-07-22得票数 1

回答已采纳

1回答

average_precision_score与precision_score的学习差异

scikit-learn、precision-recall

在文档中，它将average_precision_score描述为精确召回曲线下的区域。我很难理解这个区域意味着什么？这个度量和原始的精确评分有什么不同？

浏览 6提问于2016-01-19得票数 6

回答已采纳

3回答

准确率、召回率和F-score

precision-recall

我正在开发一个新的系统，它是基于信息检索的概念。我的系统从网上检索研究文章的pdf和ppt文件。当我计算系统的精确度、召回率和f分时，我已经产生了怀疑。我想从小组成员那里澄清这一点。令人怀疑的是，准确率、召回率和f-score之间是否会有巨大的差异。因为我计算的准确率大约是0.913，召回率非常低，比如0.3234，f-score大约是0.4323，等等，这可能吗？我的意思是，精确度和召回率会有这么大的差异吗，或者我计算错了。！！请提供您的建议以及您对一些笔记的参考。谢谢..

浏览 3提问于2011-08-23得票数 1

1回答

计算F1分数的YOLOV5

tensorflow、computer-vision、yolo

我很困惑于找出我的YOLOv5模型的确切的YOLOv5评分，它经历了150个时代的训练。此外，我怎样才能知道基于这些图表的模型是否做得很好？以下是衡量标准： Class Images Labels P R mAP@.5 mAP@.5:.95: 100% 11/11 [00:05<00:00, 2.09it/s] all 347 472 0.91 0.895 0.941 0.746 class1

浏览 0提问于2021-10-15得票数 1

1回答

Apache Spark中的多类分类错误度量

apache-spark、apache-spark-mllib、logistic-regression、multiclass-classification

是否有可能在Apache中的多类分类问题中找到错误度量(精确和召回)。我正在使用Spark的MlLib中的Logistic回归来构建我的模型，并希望使用错误度量来评估我的模型。

浏览 3提问于2018-07-02得票数 1

1回答

选择二进制分类器上的边界以达到最佳的精度和召回率

scikit-learn、logistic-regression、classifier

我有一个逻辑回归分类器，它在不同的概率边界上显示不同的精度和召回性能，如下所示： 📷 分类器决定某个类属于哪个类的默认阈值为0.5。然而，我是否正确地认识到，为了获得最佳的性能权衡，我应该将决策边界设置在以下0.82左右？这可以在Scikit-学习，但我想确保我得出正确的结论。如有任何建议，将不胜感激。

浏览 0提问于2021-01-14得票数 4

回答已采纳

1回答

评估在Spacy中训练的NER模型的好指标是什么

machine-learning、spacy、named-entity-recognition

我有3000个手动标记的数据集，分为训练集和测试集，我已经使用SpaCy训练了NER模型，以提取8个自定义实体，如“行动”，雇用日期，状态等。为了评估模型，我使用了SpaCy记分器。在输出中没有精度指标，我不确定我应该考虑哪个指标来决定模型性能是好是坏？有几种情况下准确率很低，但召回率为100，f1也很低，例如： 'LOCATION': {'p': 7.142857142857142, 'r': 100.0, 'f': 13.333333333333334}, 在上述情况下，我们的结论应该是什么？以下是得分者的全部结果，其

浏览 54提问于2019-09-02得票数 3

回答已采纳

2回答

使用f1评分、查全率和精确度选择两个最佳分类器。

machine-learning、python、classification

我有三个分类器，它们使用以下结果对相同的数据集进行分类： classifier A: precision recall f1-score micro avg 0.36 0.36 0.36 macro avg 0.38 0.43 0.36 weighted avg 0.36 0.36 0.32 classifier B: precision recall f1-score m

浏览 0提问于2018-12-28得票数 3

回答已采纳

1回答

聚合精度和召回的实际重要性是什么？

machine-learning、classification、recommendation-engine、precision-recall

我的工作是电影100 K电影数据推荐系统。我把数据分为测试和训练，计算精确性和召回率。在测试中，随机选择了超过10K的用户。我能够找到一个个人用户的精确性和召回。我想知道:聚合的精确性和召回有什么实际意义吗？

浏览 4提问于2015-06-17得票数 1

1回答

精度-召回曲线中的阈值是什么？

machine-learning、classification、auc、precision-recall、model-comparison

我知道精确度的概念以及召回的概念。但我发现很难理解“门槛”的概念，它使任何P-R曲线成为可能。想象一下，我有一个预测癌症复发(是或否)的模型，它使用相关特征上的一些像样的分类算法预测患者的癌症复发。我将我的数据拆分用于训练和测试。假设我使用训练数据训练了模型，并使用测试数据获得了精确度和召回率指标。但是现在我该如何绘制P-R曲线呢？以什么为基础？我只有两个值，一个精确度和一个召回率。我读到“阈值”可以让你得到几个精确度-召回率对。但是这个门槛是什么呢？我还是一个初学者，我不能理解门槛的概念。我在许多分类模型比较中都看到了类似下面的一个。但是他们是如何获得这么多对的呢？

浏览 7提问于2017-09-15得票数 29

回答已采纳

1回答

查准率--图像检索领域的召回率曲线

information-retrieval、precision-recall、content-based-retrieval

我正在研究两个不同季节的环路闭合检测问题，例如夏季和秋季。我需要绘制精确的回想曲线。假设我拍了500张夏天的照片和500张秋天的照片。我有距离矩阵。但我完全搞不懂，如何制作精确的回忆曲线。例如，对于一个季节的每个图像，我将按照升序(距离)获得500张最近的图像。我知道精确度和召回率的定义，但我无法接近这个问题的解决方案。期待着任何形式的帮助或评论或建议。提前谢谢。

浏览 32提问于2018-09-10得票数 0

1回答

在我的例子中，对于分类的精确性和回忆性如何比精确性更好？

classification、multiclass-classification、accuracy

我试图用一个直观的例子来理解精确和回忆，但我的计算似乎不正确。例如，有8个红色球和2个蓝色球。我很蠢，只是预测他们都是红色的。精确度为0.8，看上去很好。但这并没有反映出这只是一个幸运的，愚蠢的猜测，而且我把所有的蓝球都分类错了。如果我没有弄错，我们有8个真阳性(TP = 8)，2个假阳性(FP = 2)，在这种情况下没有正反(TN = 0，FN = 0)。那么，精度= TP/(TP+FP) = 0.8，召回= TP/(TP+FN) = 1吗？他们看起来还不错吧？

浏览 0提问于2020-10-09得票数 1

回答已采纳

2回答

聚合精度-召回曲线与精度-召回曲线的差异

text-mining、information-retrieval、precision-recall

在信息检索的背景下，像这样的一些论文谈到了聚合精度-召回曲线(参见图3)。这些曲线与Precision-Recall曲线有什么不同？这篇文章的作者似乎对这两种曲线有所不同，因为他们将图4中显示的曲线描述为精确召回曲线，而不是聚合的精确召回曲线(参见4.5节)。

浏览 0提问于2017-04-24得票数 0

4回答

F1评分与中华民国的比较

machine-learning、auc、precision-recall

我有以下两个不同案例的F1和AUC评分型号1:精度: 85.11召回: 99.04 F1: 91.55 AUC: 69.94 型号2:精度: 85.1召回: 98.73 F1: 91.41 AUC: 71.69 正确预测阳性病例的主要动机是减少假阴性病例(FN)。我应该使用F1评分并选择型号1还是使用模式2。谢谢。

浏览 0提问于2017-05-25得票数 64

6回答

计算命名实体识别中的准确率和召回率

nlp、precision-recall

现在我将报告命名实体识别的结果。我发现有一点令人困惑的是，我对精确度和召回率的理解是，一个人简单地总结了所有类别的真阳性、真阴性、假阳性和假阴性。但现在这似乎是不可信的，因为我认为每个错误分类都会同时产生一个假阳性和一个假阴性(例如，本应标记为"A“但被标记为"B”的标记是"A“的假阴性和”B“的假阳性)。因此，所有类别上的假阳性和假阴性的数量将是相同的，这意味着精度是(总是！)等同于回忆。这根本不可能是真的，所以我的推理中有一个错误，我想知道它在哪里。这当然是非常明显和直截了当的事情，但我现在想不起来了。

浏览 7提问于2009-11-23得票数 33

回答已采纳

1回答

在Keras中计算多个类的准确性的正确方法是什么？

python、tensorflow、machine-learning、keras

我试图使用Keras来评估多类问题上机器学习模型的性能。地面真理和模型的预测都在标签上。虽然从keras.metrics.Accuracy创建实例并使用实例来计算精确度相当容易，但对于精确性似乎还有另一个定义。我对这些定义感到困惑。假设有五个类标记为0、1、2、3、4，并且有四个样本。基本的真理标签是yt = [[1], [2], [3], [4]]，预测是yp = [[0], [2], [3], [4]]。然后，使用下面的代码来计算精确度是很简单的： m = keras.metrics.Accuracy() accuracy = m(yt, yp).numpy() 这是因为每4个样本中就有

浏览 6提问于2022-08-23得票数 0

1回答

精确度和召回率的几何平均值

python、python-3.x、machine-learning、classification、metrics

我正在尝试制定一个自定义指标来评估ML模型。我想让精度和召回率的加权几何平均值，并以一种优先于召回率而不是精确度的方式对其进行权衡。我知道几何平均值是sqrt(精确度*召回)，但我不确定如何将其参数化，以便在python中更重视召回。这里有来自不平衡库的度量，但是我看不到我可以提供的任何权重 imblearn.metrics.geometric_mean_score(y_true, y_pred, labels=None, pos_label=1, average='multiclass', sample_weight=None, correction=0.0) 你知道如何在p

浏览 2提问于2021-01-03得票数 2

1回答

如何评估基于内容的推荐系统

recommendation-engine

我正在构建一个基于内容的电影推荐系统。这很简单，只要用户输入一个电影标题，系统就会找到一部具有最相似功能的电影。在计算相似度并对得分进行降序排序后，我找到了相似度得分最高的5部对应的电影，并返回给用户。直到现在，当我想评估系统的准确性时，一切都运行得很好。我在Google上找到的一些公式只是基于评分值来评估准确性(比较预测评级和实际评级，如RMSE)。我没有将相似度分数更改为等级(从1到5)，所以我不能应用任何公式。您能建议任何方法将相似度分数转换为预测评分，以便我可以应用RMSE吗？或者有没有解决这个问题的办法？

浏览 1提问于2011-05-29得票数 15

回答已采纳

1回答

我应该使用什么分类模型？机器学习的新手。需要推荐

python、machine-learning、classification

目标：嘿，伙计们，我正在尝试用Python创建一个分类模型来预测共享单车站点何时会有过多的每小时相对流入或流出。我们正在做的工作是：我的数据帧的前5行(总共超过200,000行)看起来像这样，我在'flux‘列中分配了值0，1，2-如果没有重要的动作，1如果流入太多，2如果流出太多。我正在考虑使用station_name (超过300个站点)、一天中的某小时和一周中的某一天作为预测变量来对“流量”进行分类。模型选择：我应该配什么？朴素贝叶斯？KNN？随机森林？还有什么适合的吗？GDM？SVMs？仅供参考: always 0的基线预测相当高，为92.8%。不幸的是

浏览 2提问于2015-07-25得票数 0

1回答

如何在不降低不平衡数据集召回率的情况下提高精确度？

python、classification、decision-tree、precision-recall、imblearn

我必须使用决策树对不平衡数据集(50000:0,1000:1)进行二进制分类。为了有一个好的回忆(0.92)，我使用了模块Imblearn中的RandomOversampling函数，并使用了max_depth参数进行修剪。问题是精度非常低(0.44)，我有太多的误报。我试图训练一个特定的分类器来处理产生假阳性的边界实例。首先，我将数据集划分为训练集和测试集(80%-20%)。然后我在train2和test2集合中拆分训练(66%,33%)。我使用dtc(#1)来预测test2，并且我只采用预测为真的实例。然后，我在所有这些数据上训练了一个dtc(#2)，目的是建立一个能够区分边界情况的分类

浏览 0提问于2019-03-28得票数 1

1回答

检测类的sigmoid输出返回不正确的性能。

python、machine-learning、neural-network、pylearn

我的问题总结：我有一个检测(二进制分类，不平衡问题)。我用乙状结肠分类样本。报告的f-得分、精确性和回忆似乎都考虑了这两个类别，例如，真正的阳性似乎是正确分类样本的总数，而不是属于“1”类的、被正确分类的样本总数。更长的解释:在我的实验中，我有关于个人的人口统计数据，我必须预测他们是否购买了产品。我使用PCA将初始特征减少到4个，数据存储在csv文件中(第一列有类标签'0‘和'1')。请注意，大多数人没有购买，然后这两个类别是非常不平衡的。我使用CSVDataset类读取它： dataset: &train !obj:pylearn2.datasets.csv

浏览 2提问于2015-04-11得票数 0

1回答

在Sklearn中使用Classification_Report函数

python、scikit-learn、sklearn-pandas

所以我理解这个函数的工作原理是，它将一个表一分为二，然后比较这两个值以确定预测率假设我有一张表： Column1 Column2 Column3 Column4 Column5 3 2 2 43 0 1 2 2 23 1 5 5 2 56 1 4 3 2 13 0 6 1

浏览 54提问于2019-03-15得票数 1

5回答

如何评价高度不平衡数据的准确性(使用朴素贝叶斯模型)？

python、machine-learning、data-science

我在Kaggle上找到了这个，它包含了2013年9月欧洲持卡人在两天内通过信用卡进行的交易。数据集非常不平衡，欺诈只占所有交易的0.172%。我想在这个数据集上实现一个(高斯)朴素贝叶斯分类器来识别欺诈交易。我已经做了以下几件事：将数据加载到数据帧中将数据拆分为X和y 数据标准化用ADASYN处理不平衡数据集高斯朴素贝叶斯模型的建立现在，我想评估一下这些模型： from sklearn import metrics metrics.accuracy_score(y_test, y_pred_class) # Output: 0.959734277127

浏览 0提问于2018-12-14得票数 2

回答已采纳

1回答

sklearn.model_selection.cross_val_score的结果与手工计算混淆矩阵的结果不同。

python、scikit-learn、cross-validation、confusion-matrix、k-fold

当我通过CV cross_val_score()计算精确性、回忆性和f1时，它给出的结果与通过混淆矩阵计算的结果不同。为什么它给出不同的精确度，回忆，和f1的分数？我在机器学习中学习支持向量机，我想比较一下cross_val_score返回的结果和手工计算混淆矩阵的结果。然而，我有不同的结果。首先，我使用cross_val_score编写了下面的代码。 clf = svm.SVC() kfold = KFold(n_splits = 10) accuracy = metrics.make_scorer(metrics.accuracy_score) precision = metrics

浏览 14提问于2022-07-20得票数 2

回答已采纳

2回答

spacy v3中的训练NER需要在命令行中使用dev.spacy

python、spacy-3

我正在尝试在spacy v3中准备一个自定义的ner模型。从训练的角度来看，与v2相比，V3有了很大的变化。我使用en_web_lg的默认配置。我已经使用convert命令准备了训练数据(training.spacy)。但是，训练命令需要一个dev.spacy文件。不确定dev.spacy中需要哪些数据。这是在询问training.spacy文件的纯文本语料库吗？但是有没有办法将纯文本文件转换为spacy格式呢？来自spacy站点的命令- python -m spacy train config.cfg --output./output--paths.train./Train.spac

浏览 72提问于2021-04-08得票数 1

回答已采纳

1回答

我们可以使用F-measure，精度，召回率，以及排名检索结果吗？

information-retrieval、evaluation、precision-recall、indri

我正在使用Indri和TrecEval，我想知道我们是否可以使用F-measure，精度，召回率，以及排名检索结果。如果是，F度量是什么.将意味着什么？这些值是否有某种相关性，比如评估查询是否接近语料库？我知道map值是用来评估排名结果的。但我想知道如果F-measure..。可能对其他东西有用。我对此感到困惑，我做了一些研究，但有些东西我不明白。谢谢你的帮助。

浏览 1提问于2018-03-18得票数 0