我很想知道减少多类分类的监督分类模型(特别是Logistic回归)中的类数是否有助于提高分类的准确性。例如,如果我有10000个样本的50个类,并且通过将某些类组合在一起,将类的数量减少到30个。这会大大提高我的分类模型的准确性吗?
发布于 2016-02-09 17:05:52
如果您组合的类是相似的,并且它们之间有大量的错误分类,那么它肯定会提高您的性能,因为它将减少错误。
例如:
如果您分组的类不相似,它很可能不会提高您的准确性,因为您不会减少错误的数量。假设您的分类器非常好,您不会将任何猫误认为是狗,反之亦然,在组合这个类时不会减少任何错误,因为没有。
发布于 2016-02-09 18:40:12
减少类数的效果取决于算法和数据集。一般来说,不能保证减少班数会提高分类的准确性。在许多情况下,事实恰恰相反--增加类数可以提高分类的准确性。
例如,对于许多数据集,您可以使每个观察结果对应于一个唯一的类,并最终获得100%的分类准确率。这是一个明显的过度拟合的例子,但它达到了这样的程度:增加(而不是减少)类的数量有时可以提高分类的准确性。
https://stackoverflow.com/questions/35293468
复制相似问题