我在做二进制分类..。我有一个不平衡的数据,我用svm的权重来缓解这种情况.如您所见,我计算并绘制了每个类的roc曲线,并得到了以下图:
看上去这两个班有的甚至是一个..。我不确定我做的对不对,因为这是我第一次画我自己的机器人曲线.我在用Scikit学情节..。把每一班都单独画出来是对的吗。分类器是否未能对蓝色类进行分类?
这是我用来获得情节的代码:
y_pred = clf.predict_proba(X_test)[:,0] # for calculating the probability of the first class
y_pred2 = clf.predict_proba(X
我正在做一个二元分类,我和AUC一起使用的绘制的ROC曲线对我来说似乎很奇怪。下面是一个例子。
📷
据我所知,中华民国是真实阳性率与假阳性率的视觉代表。在绘制混淆矩阵时,我可以看到大量的假阴性和假阳性:
📷
我不明白为什么中华民国的曲线只有一个断点。因此,我的问题是,为什么我们会有这样的形状,而不是典型的平滑(呃)单调增长的形状?
我尝试使用n_iter参数RandomizedSearchCV、n_splits of StratifiedKFold和使用的分类器估计器(LogisticRegression(),RandomForestClassifier())。
完全可复制代码:
from s
我正在使用R包randomForest创建一个模型,该模型分为三组。
model = randomForest(formula = condition ~ ., data = train, ntree = 2000,
mtry = bestm, importance = TRUE, proximity = TRUE)
Type of random forest: classification
Number of trees: 2000
No.
我在这方面是新手,但我想为活性化合物与诱饵的一个小数据集绘制一条ROC曲线。我基于这个链接:ROC curve for binary classification in python在这种情况下,这个小数据集是一个虚拟筛选的结果,它从实验数据(IC50)中对具有已知活性或不活性的化合物进行排名和评分。 我不确定图和AUC是否正确。我注意到,即使测试(真)预测值之间只有一个值的差异,AUC也只有0.5。对于我在下面插入的代码中的真实值和预测值,它只有0.49左右。也许模型没有正确地识别这些化合物。然而,我注意到,除了一些其他位置的化合物外,它还正确地识别了排名中的前十个化合物。也许它比消极的更