我正在执行一个机器学习任务,其中我使用逻辑回归进行主题分类。
如果这是我的代码:
model= LogisticRegression()
model= model.fit(mat_tmp, label_tmp)
y_train_pred = model.predict(mat_tmp_test)
print(metrics.accuracy_score(label_tmp_test, y_train_pred))
有没有一种方法可以输出模型内部到底发生了什么。可能是我的模型正在做的一个工作示例?比如显示2-3个文档,以及它们是如何分类的?
发布于 2016-01-21 05:11:25
为了充分了解您的模型中发生了什么,您必须首先花一些时间研究逻辑回归算法(例如,来自课堂讲稿或Wikipedia)。与其他监督技术一样,logistic回归具有超参数和参数。超参数基本上指定了你的算法是如何运行的,你必须在初始化时提供(即。在它看到任何数据之前)。例如,您可以拥有有关类分布的先验信息,然后这些信息将成为超参数。参数是从你的数据中“学习”的。
一旦你理解了算法,有趣的问题将是你的模型的参数是什么(回想一下,这些参数是从数据中检索的)。通过访问documentation,您可以在attributes部分中发现这个分类器有3个参数,您可以通过它们的字段名来访问它们。
如果您对这些细节不感兴趣,但只想评估分类器的准确性,那么交叉验证是一种有用的技术。您将标记的数据拆分为k个大小相等的子集,并使用其中的k-1个子集来训练分类器。然后在剩下的1个子集上评估训练好的分类器,并计算准确率(即,多大比例的数据可以正确预测)。这种方法有其缺点,但在一般情况下被证明是非常有用的。
https://stackoverflow.com/questions/34908364
复制相似问题