我的数据中的标签是一个(N乘1)向量。对于负样本,标签值为0,对于正样本,标签值为1(因此,这是一个二进制分类问题)。我使用了sklearn的.fit
函数,并在我的火车上安装了一个随机的森林。为了计算测试集的AUC,我使用了metrics.roc_auc_score (test_labels, probabilities)
。我正在使用predict_proba(my_test_set)
来获取概率。但是,predict_proba(my_test_set)
返回一个(N_test,2)矩阵。我看到许多人使用这个返回矩阵(predict_proba(my_test_set)[:,1]
)的第二列并将其提供给metrics.roc_auc_score
来计算AUC值,但为什么是第二列?为什么不是第一列(predict_proba(my_test_set)[:,0]
)?
https://stackoverflow.com/questions/56781373
复制相似问题