Spark ML - MulticlassClassificationEvaluator -我们可以通过每个类别标签来获得精确度/召回率吗？ - 腾讯云开发者社区

、、、

我正在用Spark ML做一个随机森林的多类预测。对于spark ML中的这个MulticlassClassificationEvaluator()，是否可以通过每个类标签获得精确度/召回率？目前，我只看到所有类的精确度/召回率结合在一起。

浏览 6提问于2016-12-28得票数 12

2回答

如何在Spark ml库中从交叉验证中获得准确率、精确度、召回率和ROC？

、、、

我使用的是Spark 2.0.2。我还使用了机器学习的"ml“库和数据集。我想做的是运行交叉验证的算法，并提取提到的指标(准确性、精确度、召回率、ROC、混淆矩阵)。我的数据标签是二进制的。通过使用MulticlassClassificationEvaluator，我只能通过访问"avgMetrics“来获得算法的准确性。此外，通过使用BinaryClassif

浏览 0提问于2017-01-18得票数 10

1回答

全球多标签性能评估的平均精度/召回是否正确？

、、、、

让我们讨论标签A、B和C的多标签分类问题。我可以计算每个标签的精确度/召回率，如下所示： F1度量:2*(精确*召回)/(精确+召回)因为我有3个标签，所以我想通过平均每个节点的值来<e

浏览 4提问于2013-12-13得票数 2

3回答

我在Postgres数据库中存储了大约30万个文档，这些文档带有主题类别(总共大约有150个类别)。我还有另外15万个还没有分类的文档。我正在尝试找到对它们进行程序化分类的最佳方法。我的问题是，我没有足够的内存来一次训练所有150个categoies/300k文档上的NaiveBayesClassifier (5个类别的训练使用8 8GB)。此外，随着我对更多类别的训练，分类器的准确性似乎会下降(2个类别的准确率为90%，5个类别的准确<em

浏览 0提问于2010-06-25得票数 33

回答已采纳

5回答

多类多标签分类的精度/召回率

、、、

我想知道如何计算多类多标签分类的精度和召回率，即有两个以上标签的分类，以及每个实例可以有多个标签的分类？

浏览 1提问于2012-01-25得票数 29

6回答

计算命名实体识别中的准确率和召回率

、

我发现有一点令人困惑的是，我对精确度和召回率的理解是，一个人简单地总结了所有类别的真阳性、真阴性、假阳性和假阴性。但现在这似乎是不可信的，因为我认为每个错误分类都会同时产生一个假阳性和一个假阴性(例如，本应标记为"A“但被标记为"B”的标记是"A“的假阴性和”B“的假阳性)。因此，所有类别上的假阳性和假阴性的数量将是相同的，这意味着精度是(总是！)等同于回忆。这根本不可能是真的，所以我的推理中有一个错误，我想知道它在哪里。

浏览 7提问于2009-11-23得票数 33

回答已采纳

3回答

如何解释scikit的学习混淆矩阵和分类报告？

、、、、

我有一个情感分析任务，对于这个，我的观点有5个类别(very neg，neg，neu，pos，very pos)，从1到5。SVCsvm_1.fit(X, y)然后，使用这些指标，我获得了以下混淆矩阵和分类报告但仍然可以解释这里发生了什么，特别是使用这些数据？为什么这个矩阵是“对角线”的？另一方面，什么是召回率、精确度、f1s

浏览 1提问于2015-06-10得票数 33

回答已采纳

1回答

为什么F1-得分、召回率、精确度都等于1？(图像分类linearSVM)

、、、

然而，在运行代码后，F1分数、精度和召回率都等于1。我不知道这是怎么发生的。

浏览 1提问于2019-05-05得票数 0

1回答

多标签分类的性能评价

、、

因此，为了评估多标签分类算法(每个实例都与多个标签相关联)，我同时考虑了准确性和F1-Measure。

浏览 2提问于2013-12-04得票数 5

2回答

sklearn.metrics.precision_recall_curve:为什么精度和召回返回的是数组而不是单个值

、、、

我正在计算我最近准备的数据集上现成算法的精度和召回率。 0.01775148, 0.01183432, 0.00591716, 0. ]))因为精度是作为tpf/(tpf+

浏览 1提问于2016-07-03得票数 5

3回答

为什么平衡测试数据集可以提高查全率曲线？

、、

然而，精确召回曲线在整体上看上去很糟糕。但如果我要平衡测试集，精确召回曲线看起来要好得多。这一切为什么要发生？在数据分布不平衡的情况下，我是否应该进行一些调整，以提高查全率？

浏览 0提问于2018-10-29得票数 5

2回答

朴素贝叶斯多类预测的评价结果

、、

我在MATLAB中使用了朴素贝叶斯(内置)来预测我的数据的类别标签值。我的类标签可以是{1,2,3,4,5}中的任何值。我也有testLabels。但看起来它给了我1.87124的价值此外，对于朴素贝叶斯多类结果的评估，是否有标准的评估方法？我知道对于二进制标签分类，我可以使用TPR，FPR，Precision，Accuracy等。

浏览 2提问于2012-12-05得票数 2

1回答

为多类分类问题中的最优精度/召回确定每个类别的阈值。

VS-rest精确/召回图，并且我决定每个类的最佳阈值为如果索引i ( M的最大得分大于或等于否则，不要将X分配给任何东西，请参阅下面的两个示例以获得X的两个输入： M(X_1) = [0.8,0.1,0.1] \rightarrow C_1\quad，因为最大的套接字是0.8，它用于1类和T_，我们不会为每个类保留最佳的精确度</em

浏览 0提问于2022-03-22得票数 3

1回答

Spark中的随机森林

、、、、

我在spark中编写了下面的交叉验证代码from pyspark.ml.evaluation我知道AUC是用于二进制类的，但是我们可以通过绘制不同的二进制类并获得它们的AUC来得到多类的组合或平均AUC。Sri-kit learn对多类AUC做了同样的事情。另外，如果我在hyparameter搜索空间中不使用1000和800树，而只是将其保持为

浏览 1提问于2017-01-28得票数 0

2回答

信息检索评估python精度，召回，f分数，AP，MAP

、、

我写了一个程序来做信息的检索和提取。用户在搜索栏中输入查询，程序可以显示相关的文本结果，如相关句子和组成句子的文章。然而，我对此还是个新手。如何计算结果。因为我的数据集没有标记，而且我也没有进行分类。我使用的数据集是来自BBC新闻的文章。总共有200篇文章。

浏览 5提问于2016-11-07得票数 2

4回答

机器学习-训练步骤

、、、

你真的需要找到成千上万的正负样本吗？一定有更有效的方法来做这件事... 我正在尝试在matlab中分析图像(而不是人脸)，并且是图像处理的新手。

浏览 0提问于2010-05-04得票数 2

3回答

11pt的平均精度度量是多少？

、、

我有两个问题2-如何在信息检索中使用它？

浏览 0提问于2009-08-15得票数 4

4回答

聚类算法的性能分析

、、、

(或两者兼备)事先非常感谢， T

浏览 7提问于2012-03-13得票数 1

回答已采纳

2回答

如何使用NLP对客户投诉进行分类

、、、、

我有一个社区投诉数据集，我想在这些描述上建立一个NLP模型，并将一个类别(可以用于检查或不引用)标记给每个类别。布尔答案(是或否)就足以满足我的要求。例如:我们的客户服务部门处理通过电话或电子邮件收到的带有“推荐”或“未提及”状态的投诉。现在，他们正在检查描述，手动将其分类为“所引用”或“未引用”。ML模型应该将未来的投诉分类为两个桶，将他们收到的问题分类成桶，这将有助于部门为每个组的客户提供定制的解决方案。在NLP中是否有一种方法来</em

浏览 0提问于2022-01-10得票数 0

回答已采纳

1回答

不平衡类f1分数含义

、、、

我的想法是，如果模型能很好地预测0级，为什么我们不直接反转这个问题，预测0级呢？因为只有2个类，如果它不是0类，那么它就是1类。换句话说，如果模型可以将数据识别为类0，那么它肯定不是类1(特别是当类0的精度为1时)。这意味着模型仍然做得很好。它是这样工作的吗？为什么不行？在此之前，非常感谢您。

浏览 50提问于2021-01-04得票数 0

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云