我想知道如何使用混淆矩阵、情感分析、使用混淆矩阵的多类分类器来计算精度和回忆。我有一个5000条文字的数据集,我给100个样本做了人类标记。现在,我想根据这个数据样本来计算分类器的精确度和召回率。,那么我如何计算每个类的这些度量呢?由于我在堆栈溢出中是新手,我无法说明我所拥有的混淆矩阵,所以让我们假设我们有以下混淆矩阵:
red
我正在寻找一个使用Spark-Scala的多类分类示例,但我还找不到。具体地说,我想训练一个分类模型,并查看训练和测试数据上的所有相关指标。Spark ML (基于DataFrame的API)是否支持多类问题的混淆矩阵?
我正在寻找Spark v2.2及以上的例子。一个端到端的例子将会非常有用。我在这里找不到混淆矩阵评估-