我用微观和宏观F-分数绘制了一个多项式朴素贝叶斯分类器的学习曲线.
第一幅图是用微F分制作的,第二幅是用宏F分制作的.我觉得很难把它们都解释清楚。我为学习曲线找到的解释使用了错误。
我认为在第一幅图中,有大约300个实例的可变性,然后它开始收敛,直到直线平行时为止。因此,即使添加更多的数据也于事无补。但是偏见呢?
另外,你能不能向我解释一下在微观和宏观F-分数方面的差异?
发布于 2020-02-09 07:14:36
微观计算F积分是通过计算总阳性、假阴性和假阳性来计算的。
宏计算每个标签的F分数,并找出它们的未加权平均值。宏观F分数不考虑标签的不平衡。
考虑到您的性能在度量之间存在差异,您的数据在类标签的基准率上是不平衡的。
向少数类(Es)添加更多数据将有所帮助。
https://datascience.stackexchange.com/questions/58518
复制