腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(210)
视频
沙龙
0
回答
Spark
ML
-
MulticlassClassificationEvaluator
-
我们
可以
通过
每个
类别
标签
来
获得
精确度
/
召回
率
吗
?
、
、
、
我正在用
Spark
ML
做一个随机森林的多类预测。 对于
spark
ML
中的这个
MulticlassClassificationEvaluator
(),是否
可以
通过
每个
类
标签
获得
精确度
/
召回
率
?目前,我只看到所有类的
精确度
/
召回
率
结合在一起。
浏览 6
提问于2016-12-28
得票数 12
2
回答
如何在
Spark
ml
库中从交叉验证中
获得
准确
率
、
精确度
、
召回
率
和ROC?
、
、
、
我使用的是
Spark
2.0.2。我还使用了机器学习的"
ml
“库和数据集。我想做的是运行交叉验证的算法,并提取提到的指标(准确性、
精确度
、
召回
率
、ROC、混淆矩阵)。我的数据
标签
是二进制的。
通过
使用
MulticlassClassificationEvaluator
,我只能
通过
访问"avgMetrics“
来
获得
算法的准确性。此外,
通过
使用BinaryClassif
浏览 0
提问于2017-01-18
得票数 10
1
回答
全球多
标签
性能评估的平均精度/
召回
是否正确?
、
、
、
、
让
我们
讨论
标签
A、B和C的多
标签
分类问题。我
可以
计算
每个
标签
的
精确度
/
召回
率
,如下所示: F1度量:2*(精确*
召回
)/(精确+
召回
)因为我有3个
标签
,所以我想
通过
平均
每个
节点的值
来
<e
浏览 4
提问于2013-12-13
得票数 2
3
回答
将文档分类为多个
类别
、
、
、
、
我在Postgres数据库中存储了大约30万个文档,这些文档带有主题
类别
(总共大约有150个
类别
)。我还有另外15万个还没有分类的文档。我正在尝试找到对它们进行程序化分类的最佳方法。我的问题是,我没有足够的内存
来
一次训练所有150个categoies/300k文档上的NaiveBayesClassifier (5个
类别
的训练使用8 8GB)。此外,随着我对更多
类别
的训练,分类器的准确性似乎会下降(2个
类别
的准确
率
为90%,5个
类别
的准确<em
浏览 0
提问于2010-06-25
得票数 33
回答已采纳
5
回答
多类多
标签
分类的精度/
召回
率
、
、
、
我想知道如何计算多类多
标签
分类的精度和
召回
率
,即有两个以上
标签
的分类,以及
每个
实例
可以
有多个
标签
的分类?
浏览 1
提问于2012-01-25
得票数 29
6
回答
计算命名实体识别中的准确
率
和
召回
率
、
我发现有一点令人困惑的是,我对
精确度
和
召回
率
的理解是,一个人简单地总结了所有
类别
的真阳性、真阴性、假阳性和假阴性。但现在这似乎是不可信的,因为我认为
每个
错误分类都会同时产生一个假阳性和一个假阴性(例如,本应标记为"A“但被标记为"B”的标记是"A“的假阴性和”B“的假阳性)。因此,所有
类别
上的假阳性和假阴性的数量将是相同的,这意味着精度是(总是!)等同于回忆。这根本不可能是真的,所以我的推理中有一个错误,我想知道它在哪里。
浏览 7
提问于2009-11-23
得票数 33
回答已采纳
3
回答
如何解释scikit的学习混淆矩阵和分类报告?
、
、
、
、
我有一个情感分析任务,对于这个,我的观点有5个
类别
(very neg,neg,neu,pos,very pos),从1到5。SVCsvm_1.fit(X, y)然后,使用这些指标,我
获得
了以下混淆矩阵和分类报告但仍然
可以
解释这里发生了什么,特别是使用这些数据?为什么这个矩阵是“对角线”的?另一方面,什么是
召回
率
、
精确度
、f1s
浏览 1
提问于2015-06-10
得票数 33
回答已采纳
1
回答
为什么F1-得分、
召回
率
、
精确度
都等于1?(图像分类linearSVM)
、
、
、
然而,在运行代码后,F1分数、精度和
召回
率
都等于1。我不知道这是怎么发生的。
浏览 1
提问于2019-05-05
得票数 0
1
回答
多
标签
分类的性能评价
、
、
因此,为了评估多
标签
分类算法(
每个
实例都与多个
标签
相关联),我同时考虑了准确性和F1-Measure。
浏览 2
提问于2013-12-04
得票数 5
2
回答
sklearn.metrics.precision_recall_curve:为什么精度和
召回
返回的是数组而不是单个值
、
、
、
我正在计算我最近准备的数据集上现成算法的精度和
召回
率
。 0.01775148, 0.01183432, 0.00591716, 0. ]))因为精度是作为tpf/(tpf+
浏览 1
提问于2016-07-03
得票数 5
3
回答
为什么平衡测试数据集
可以
提高查全率曲线?
、
、
然而,精确
召回
曲线在整体上看上去很糟糕。 但如果我要平衡测试集,精确
召回
曲线看起来要好得多。这一切为什么要发生?在数据分布不平衡的情况下,我是否应该进行一些调整,以提高查全率?
浏览 0
提问于2018-10-29
得票数 5
2
回答
朴素贝叶斯多类预测的评价结果
、
、
我在MATLAB中使用了朴素贝叶斯(内置)
来
预测我的数据的
类别
标签
值。我的类
标签
可以
是{1,2,3,4,5}中的任何值。我也有testLabels。但看起来它给了我1.87124的价值此外,对于朴素贝叶斯多类结果的评估,是否有标准的评估方法?我知道对于二进制
标签
分类,我
可以
使用TPR,FPR,Precision,Accuracy等。
浏览 2
提问于2012-12-05
得票数 2
1
回答
为多类分类问题中的最优精度/
召回
确定
每个
类别
的阈值。
VS-rest精确/
召回
图,并且我决定
每个
类的最佳阈值为 如果索引i ( M的最大得分大于或等于否则,不要将X分配给任何东西,请参阅下面的两个示例以
获得
X的两个输入: M(X_1) = [0.8,0.1,0.1] \rightarrow C_1\quad,因为最大的套接字是0.8,它用于1类和T_,
我们
不会为
每个
类保留最佳的
精确度</em
浏览 0
提问于2022-03-22
得票数 3
1
回答
Spark
中的随机森林
、
、
、
、
我在
spark
中编写了下面的交叉验证代码from pyspark.
ml
.evaluation我知道AUC是用于二进制类的,但是
我们
可以
通过
绘制不同的二进制类并
获得
它们的AUC来得到多类的组合或平均AUC。Sri-kit learn对多类AUC做了同样的事情。另外,如果我在hyparameter搜索空间中不使用1000和800树,而只是将其保持为
浏览 1
提问于2017-01-28
得票数 0
2
回答
信息检索评估python精度,
召回
,f分数,AP,MAP
、
、
我写了一个程序
来
做信息的检索和提取。用户在搜索栏中输入查询,程序
可以
显示相关的文本结果,如相关句子和组成句子的文章。然而,我对此还是个新手。如何计算结果。因为我的数据集没有标记,而且我也没有进行分类。我使用的数据集是来自BBC新闻的文章。总共有200篇文章。
浏览 5
提问于2016-11-07
得票数 2
4
回答
机器学习-训练步骤
、
、
、
你真的需要找到成千上万的正负样本
吗
?一定有更有效的方法
来
做这件事... 我正在尝试在matlab中分析图像(而不是人脸),并且是图像处理的新手。
浏览 0
提问于2010-05-04
得票数 2
3
回答
11pt的平均精度度量是多少?
、
、
我有两个问题2-如何在信息检索中使用它?
浏览 0
提问于2009-08-15
得票数 4
4
回答
聚类算法的性能分析
、
、
、
(或两者兼备)事先非常感谢, T
浏览 7
提问于2012-03-13
得票数 1
回答已采纳
2
回答
如何使用NLP对客户投诉进行分类
、
、
、
、
我有一个社区投诉数据集,我想在这些描述上建立一个NLP模型,并将一个
类别
(
可以
用于检查或不引用)标记给
每个
类别
。布尔答案(是或否)就足以满足我的要求。例如:
我们
的客户服务部门处理
通过
电话或电子邮件收到的带有“推荐”或“未提及”状态的投诉。现在,他们正在检查描述,手动将其分类为“所引用”或“未引用”。
ML
模型应该将未来的投诉分类为两个桶,将他们收到的问题分类成桶,这将有助于部门为
每个
组的客户提供定制的解决方案。 在NLP中是否有一种方法
来</em
浏览 0
提问于2022-01-10
得票数 0
回答已采纳
1
回答
不平衡类f1分数含义
、
、
、
我的想法是,如果模型能很好地预测0级,为什么
我们
不直接反转这个问题,预测0级呢?因为只有2个类,如果它不是0类,那么它就是1类。换句话说,如果模型
可以
将数据识别为类0,那么它肯定不是类1(特别是当类0的精度为1时)。这意味着模型仍然做得很好。 它是这样工作的
吗
?为什么不行? 在此之前,非常感谢您。
浏览 50
提问于2021-01-04
得票数 0
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
Python大数据处理库PySpark实战——使用PySpark处理文本多分类问题
如何用机器学习模型,为十几亿数据预测性别
机器学习与Scikit Learn学习库
作为AI产品经理,我们到底在优化什么?
用神经网络算法,预测乳腺肿瘤性质
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券