我正试图找到一个二元结果的最佳预测指标。
对每例病例,A Y%,C= Z%。A和B是相互关联的变量(剂量X到卷Y%)。C是在每一种情况下这种情况出现的频率。
然后,我有不同的C阈值,我可以用它来预测二进制结果(P)。我也有(O) -真正的结果(二进制)。
我看到的是多个X,Y和C值,它们最适合P到O。
因此,对于X(4个离散点)和Y( 10%间隔内为10-90%)的每一个组合,我有一个结果C (%)。对于不同的C阈值( 10% -90%,间隔10%),我有正确预测的病例数,以及2x2混淆矩阵和敏感性及特异性。
在统计方面,我想我可以用ROC曲线来找到最好的预测因子?但我不确定这是否正确,或者我是否可以简单地比较每一个X,Y的所有组合或C的不同阈值?还是同一阈值C的不同X,Y?还是我应该做一个不同的统计测试?
但假设我在做ROC曲线。我用MATLAB (散点图)和线y=x (自反= (1,0))绘制了所有的点。所以我知道重要的点是对角线以上的点,但是如何拟合实际的ROC曲线来计算AUC呢?
我知道这让人困惑,所以我希望这是有意义的!
编辑:我现在想的是,对于每一个X,Y组合,C的不同阈值,我需要一个ROC曲线。在每一种情况下,最好的C阈值是最近的点1,0 (我如何找到它?最近的几何学?)然后我比较了每个X,Y组合的AUC,以及面积最大的组合是最好的?
发布于 2015-11-09 13:47:38
我在这些链接上回答了类似的问题:ROC curve and libsvm和MATLAB - generate confusion matrix from classifier
请仔细看一遍让我知道你的怀疑。
https://stackoverflow.com/questions/33177690
复制相似问题