首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

在Python中手工计算AUC

(Area Under the Curve)可以通过以下步骤实现:

  1. 首先,导入必要的库,如numpy和sklearn.metrics。
代码语言:python
代码运行次数:0
复制
import numpy as np
from sklearn.metrics import roc_auc_score
  1. 准备真实标签和预测概率值。假设真实标签为y_true,预测概率值为y_pred。
代码语言:python
代码运行次数:0
复制
y_true = np.array([0, 1, 1, 0, 1])
y_pred = np.array([0.2, 0.6, 0.8, 0.3, 0.9])
  1. 使用numpy.argsort函数根据预测概率值对真实标签进行排序。
代码语言:python
代码运行次数:0
复制
sorted_indices = np.argsort(y_pred)
  1. 根据排序后的真实标签计算正样本的秩次和负样本的秩次。
代码语言:python
代码运行次数:0
复制
positive_ranks = np.sum(y_true[sorted_indices] == 1)
negative_ranks = np.sum(y_true[sorted_indices] == 0)
  1. 计算AUC值。
代码语言:python
代码运行次数:0
复制
auc = (positive_ranks - (positive_ranks * (positive_ranks + 1)) / 2) / (positive_ranks * negative_ranks)
  1. 打印AUC值。
代码语言:python
代码运行次数:0
复制
print("手工计算的AUC值为:", auc)

完整代码如下:

代码语言:python
代码运行次数:0
复制
import numpy as np
from sklearn.metrics import roc_auc_score

y_true = np.array([0, 1, 1, 0, 1])
y_pred = np.array([0.2, 0.6, 0.8, 0.3, 0.9])

sorted_indices = np.argsort(y_pred)
positive_ranks = np.sum(y_true[sorted_indices] == 1)
negative_ranks = np.sum(y_true[sorted_indices] == 0)

auc = (positive_ranks - (positive_ranks * (positive_ranks + 1)) / 2) / (positive_ranks * negative_ranks)

print("手工计算的AUC值为:", auc)

AUC是评估二分类模型性能的常用指标,它代表了ROC曲线下的面积,范围在0到1之间,值越大表示模型性能越好。AUC值为0.5时表示模型性能等同于随机猜测,大于0.5时表示模型优于随机猜测。

推荐的腾讯云相关产品和产品介绍链接地址:

页面内容是否对你有帮助?
有帮助
没帮助

相关·内容

Sci. Adv. | 治疗性遗传靶点的全表型识别

今天为大家介绍的是来自Dimitrios Vitsios团队的一篇论文。人类基因组数据集的持续扩展推动了治疗靶点的识别,然而,从基因注释中提取基因-疾病关联仍然具有挑战性。在这里,作者介绍了Mantis-ML 2.0这一框架,它整合了阿斯利康的生物学洞察力知识图谱与多个表格数据集,评估了整个表型组的基因-疾病概率。作者使用图神经网络,捕捉图的整体结构,并在数百个平衡数据集上通过一个鲁棒的半监督学习框架进行训练,以提供人类外显子组的基因-疾病概率。Mantis-ML 2.0结合了自然语言处理,自动化数千种疾病的疾病相关特征选择。改进的模型展示了平均6.9%的分类能力提升,实现了在5220种来自人类表型本体、OpenTargets和英国基因组学的疾病上的中位接收者操作特征(ROC)曲线下面积(AUC)得分为0.90。值得注意的是,Mantis-ML 2.0优先考虑了来自独立的英国生物库表型广泛关联研究(PheWAS)的关联,提供了一种更强的分选方式,并减轻了PheWAS关联的不足。

01

深度学习系列 | 深度学习在搜狗无线搜索广告中的应用

编者:本文来自搜狗资深研究员舒鹏在携程技术中心主办的深度学习Meetup中的主题演讲,介绍了深度学习在搜狗无线搜索广告中的应用及成果。戳上面的“携程技术中心”(ctriptech)关注,可获知更多技术分享信息哦。 舒鹏老师的分享可点下面的视频看回放,下载演讲PPT请点击阅读原文。 搜索引擎广告是用户获取网络信息的渠道之一,同时也是互联网收入的来源之一,通过传统的浅层模型对搜索广告进行预估排序已不能满足市场需求。近年来,深度学习在很多领域得到广泛应用并已取得较好的成果,本次演讲就是分享深度学习如何有效的运用在

011

​基于AI的脑电信号独立成分的自动标记工具箱

脑电图(EEG)信号反映了大脑神经元网络的生物电活动,可用于研究睡眠,诊断昏迷和癫痫患者,使用户能够与电子设备进行互动,并帮助人们从中风或其他损害正常大脑活动的状况中恢复。独立成分分析(ICA)是一种从脑电图中排除眼球运动和肌肉伪影等非脑信号的传统方法。独立成分(IC)的排除通常是在半自动模式下进行的,需要专家参与,并且各个专家的意见往往不一致。来自俄罗斯国立高等经济大学生物电接口中心和RAS高级神经活动和神经生理学研究所的研究人员开发了一个工具箱和在线众包平台,用于脑电图中独立成分的自动标记(ALICE)。

02

J. Chem. Inf. Model. | 双通道异构图神经网络用于预测microRNA调控的药物敏感性

今天为大家介绍的是来自Hui Liu团队的一篇关于预测miRNA和药物关系的论文。许多研究已经确认microRNA(miRNA)在肿瘤细胞对抗癌药物的敏感性中起到调节作用。miRNA作为一种有前景的治疗靶点,正在逐渐受到关注,以克服药物抵抗。然而,对于miRNA与药物敏感性之间的关联的计算预测受到了有限的关注。在这项工作中,作者提出了一种基于异构网络的表示学习方法来预测miRNA药物敏感性关联(DGNNMDA)。通过整合miRNA相似性网络、药物相似性网络和实验证实的miRNA药物敏感性关联,构建了一个miRNA-药物异构网络。接下来,作者开发了一个双通道异构图神经网络模型,在同质和异质节点之间执行特征传播,以便使方法可以学习miRNA和药物节点的表达表示。

04
领券