首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
您找到你想要的搜索结果了吗?
是的
没有找到

J. Chem. Inf. Model. | 提高化合物-蛋白质相互作用预测的方法:通过使用增加的负样本进行自我训练

今天为大家介绍的是来自Yasushi Okuno团队的一篇论文。识别化合物-蛋白质相互作用(CPI)对于药物发现至关重要。由于实验验证CPI通常耗时且昂贵,因此期望计算方法能够促进这一过程。可用的CPI数据库迅速增长加速了许多机器学习方法用于CPI预测的发展。然而,它们的性能,特别是它们在外部数据上的泛化能力,往往受到数据不平衡的影响,这归因于缺乏经验证的非活性(负面)样本。在这项研究中,作者开发了一种自我训练方法,用于增加可信和信息丰富的负样本,以改善由数据不平衡导致的模型性能下降问题。构建的模型表现出比使用其他传统方法解决数据不平衡时更高的性能,且在外部数据集上改进明显。

04
领券