基于一些语言学理论,我已经编写了自己的文本分类器。分类器的最终结果是文章标题和二进制类别的元组对。
我还在我的金标语料库上使用了NB分类器,并使用Python中的Sci-kit学习库通过CV评估了它的性能。然而,我正在努力找出如何评估我自己的分类器的性能。:S
我非常感谢你的想法,因为我不是有经验的机器学习者。
谢谢,
古兹德
发布于 2016-05-12 12:29:01
要评估分类器,最常见的指标是准确性,但没有适用于所有可能情况的经验法则,因此我建议您阅读一些关于分类器的评估指标。还可以阅读有关评估方法的内容。
如果你没有时间,现在坚持准确性和交叉验证,但一定要理解给定的指标意味着什么,你的方法意味着什么,如何读取混淆矩阵,每个指标和方法的优缺点,特别是它的局限性。
Scikit Learn的指标参考页面:Link
Scikit Learn的交叉验证用户指南:Link
你说过你有自己的黄金标准。你说过你有你的模型。然后,您只需选择一个指标和一种评估方法。
您的模型将在给定输入(一组功能)的情况下预测类/目标。然后将预测与您的基本事实/黄金标准进行比较。
https://stackoverflow.com/questions/37160144
复制相似问题