我想知道如何使用混淆矩阵、情感分析、使用混淆矩阵的多类分类器来计算精度和回忆。我有一个5000条文字的数据集,我给100个样本做了人类标记。现在,我想根据这个数据样本来计算分类器的精确度和召回率。我有三门课:积极、中立和消极。red color > Negative
green color > Positiv
我用Apache uimaFIT和DKPro构建的命名实体识别(NER)管道在文本(例如人员、位置、组织等)中识别命名实体(目前称为数据类型)。我有一个黄金语料库和一个结果语料库,我想计算精度,回忆和F1评分。到目前为止,我计算这些指标如下:
1.Average precision, recall and F1 score per datatype for all document