在使用logistic回归的手写体数字识别问题中,正常的实现甚至会强制将狗或猫的图片归类为数字。要消除这种情况,需要进行哪些更改才能添加另一个类:对已经存在的10个类(0到9)“没有数字”?
发布于 2019-08-17 08:43:04
如果您使用的是一个对所有的分类,您可以使用一个条件,如果没有类达到最小的概率,那么它不是一个数字。或者你可以用另一个类别“不是数字”来训练分类器。或者使用一个由两个分类器组成的管道,一个用来告诉你图片是否是一个数字,如果是一个数字,对这个数字进行分类。
发布于 2018-11-16 08:57:48
Logistic回归通常用于执行二进制分类,回答是或否问题,例如:
也许我误解了你的解释,但听起来你似乎是在尝试进行多类分类,即将图像归类为一定数量的选项之一。因此,单个图像必须包含(分类为)列表中的一个数字:[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
。
通常,要向已经这样做的模型添加一个额外的类,您需要调整模型的最终输出,以预测单热向量,这只需再增加一个元素!
在Scikit的具体案例中--学习LogosticRegression类,似乎您不需要指定任何东西--当类看到数据不是二进制数据时,它就会自动使用多项模型和相关的优化器(即,如上面所解释的是--否模型)。
请看一看本官方教程,它应该是一个多项模型,该模型在一个数据集上训练,其中包含一个目标变量,总共有20个类。特征数(n_classes
等于20
)根本没有传递给模型,这是推断出来的。
https://datascience.stackexchange.com/questions/41295
复制相似问题