首页
学习
活动
专区
工具
TVP
发布

DrugAI

关注人工智能与化学、生物、药学和医学的交叉领域进展,提供“原创、专业、实例”的解读分享。
专栏作者
1050
文章
643056
阅读量
112
订阅数
基于知识指令的人类语言-蛋白质语言对齐模型
近年来,大语言模型的出现革新了自然语言处理领域。ChatGPT,Claude-2等模型已经深入到人们的日常生活中了如语言翻译、信息获取、代码生成。但这些语言模型在自然语言和代码语言上极强的处理能力并不能迁移到生物序列(如蛋白质序列)上。当让其描述一条蛋白质序列的功能或者生成一条符合某种性质的蛋白质,它们常常不会遵从指令,或者给出错误答案。文章认为这一现象的出现是因为当前蛋白质-文本对数据集存在两个缺陷:(1)缺乏指令信号;(2)数据注释的不均衡。这两个缺陷导致模型对蛋白质序列建模效果不好且无法有效理解用户的意图。为了弥补这些缺陷,本文提出了一种自动构建蛋白质-文本指令数据集的方法,通过在这个数据集上进行指令微调,模型可以大幅提升蛋白质序列的理解能力和指令跟随能力。本文首次探索了蛋白质语言和人类语言的双向生成能力,展示了将生物序列作为大语言模型能力一部分的潜力,为其更好的服务科学领域提供可能。
DrugAI
2023-12-26
1660
Nat. Biotechnol.| BioCypher推动生物医学知识表征大一统
今天我们介绍由海德堡大学医学院的Sebastian Lobentanzer等学者发表在Nature Biotechnology上的工作。在所有研究人员之中,标准化的生物医学知识表征是一项难以克服的任务,它阻碍了许多计算方法的有效性。为了促进知识表征的协调和互操作性,该工作将知识图谱创建的框架标准化。本文提出的BioCypher实现了这一标准化,这是一个FAIR(可查找、可访问、可互操作、可重用)框架,可以透明地构建生物医学知识图谱,同时保留源数据的来源。将知识映射到生物医学本体有助于平衡协调、人类和机器可读性以及对非专业研究人员的易用性和可访问性的需求。本文展示了该框架在各种用例中的有用性,从维护特定于任务的知识存储,到生物医学领域之间的互操作性,再到为联邦学习按需构建特定于任务的知识图。
DrugAI
2023-09-19
2360
Nature Methods | 针对罕见病的机器学习方法
今天为大家介绍的是来自Casey Greene团队的一篇综述论文。高通量分析方法(如基因组学或成像)加速了基础研究,并使对患者样本的深度分子特征化成为例行程序。这些方法提供了关于参与疾病表型的基因、分子途径和细胞类型的丰富信息。机器学习(ML)可以成为从高维数据集中提取与疾病相关模式的有用工具。然而,根据生物学问题的复杂性,机器学习通常需要许多样本来识别重复出现且具有生物学意义的模式。罕见病在临床案例中天然受限,导致可供研究的样本较少。作者概述了在罕见病中使用机器学习处理小样本集的挑战和新兴解决方案。罕见病的机器学习方法的进展可能对其他具有高维数据但样本较少的应用有所启发。作者建议方法研究社区优先发展罕见病研究的机器学习技术。
DrugAI
2023-09-19
2240
Bioinformatics | 链路感知的图注意力网络用于药物-药物相互作用预测
今天给大家介绍由厦门大学刘向荣教授团队发表在Bioinformatics上的文章,文章提出一个用于DDI预测的链接感知图注意网络,称为LaGAT。该模型能够基于不同的药物对在知识图谱中为药物实体产生不同的注意途径;作者在两个公开的DDI数据集上进行了实验,并可视化了模型生成的注意力路径。结果证明,LaGAT能够更好地捕捉语义关系,并能够基于知识图谱做出更具有可解释性的DDI预测。
DrugAI
2022-11-28
7050
KDD 2022 | 编程指南:生命科学中的图神经网络
本文介绍由亚马逊的研究团队推出的应用于生命科学的图神经网络指南《Graph Neural Networks in Life Sciences: Opportunities and Solutions》,这个工作发表在2022年数据挖掘顶会KDD上。图结构数据在生命科学以及医疗场景无处不在,最近很多研究把原来依赖于描述性数据分析的问题转化成依赖于生物网络的问题,例如图神经网络 (GNNs)。与其它领域相比,生命科学的问题有其自身的独特性和细微的差别。首先,这份指南比较全面地介绍了生命科学中的各种图结构数据,基于这些数据的生物和医学问题,以及相关的基于图机器学习的算法;随后,作者提供了四类基于GNN的解决方案的编程指南,每一种方案都提供了python代码和比较详细的说明,这四类问题包括:1)小分子属性预测;2)大分子属性和功能预测;3)基于双图(bi-graph)的蛋白质-配体对亲和力预测;4)利用知识图谱进行医学预测。所有代码都基于深度学习库DGL-lifesci和DGL-KE。
DrugAI
2022-11-28
3380
KG-MTL:知识与数据双驱动的药物靶标预测方法
传统药物研发过程漫长,投入大,风险高。新药研发的平均时间长达15年,平均耗费超过8亿美元。作为药物研发的源头,药物靶标的发现和识别对药物的研发成功率具有决定性的作用。随着人工智能和机器学习逐渐应用于医药健康和药物研究,以及蛋白质组学数据、化学基因组学数据的日益增长,可为药物新靶标发现提供信息技术支撑,并为靶标识别预测提供新的思路。
DrugAI
2022-11-28
4510
Nat. Commun. | 用于加速发现抗生素抗性基因的知识整合和决策支持
今天介绍一篇美国加州大学戴维斯分校研究团队在nature communications发表的一篇论文“Knowledge integration and decision support for accelerated discovery of antibiotic resistance genes”。本文提出了一个知识集成和决策支持的框架(KIDS),通过知识图谱的构建、数据不一致性的消除和迭代链接的预测来实现自动化的知识发现。本文综合10个公开数据源的知识,构建了一个大肠杆菌抗生素耐药性知识图谱,包含来自23种三元组类型的651,758个关联关系。作者对图进行迭代链接预测,并对生成的假设进行湿式验证,发现了15个抗生素耐药的大肠杆菌基因,其中6个基因从未被报道与微生物的抗生素耐药性有关。阳性结果的概率与实验验证的结果高度相关。此外,在肠道沙门氏菌(Salmonella enterica)中发现了5个同源物,它们都被验证对抗生素有抗性。这项工作展示了证据驱动的决策能以更高的置信度和更快的速度实现自动化的知识发现,从而取代传统的耗时且昂贵的方法。
DrugAI
2022-06-10
4040
PrimeKG : 构建知识图谱以实现精确医疗
本文介绍了一篇由Payal Chandak、Kexin Huang和Marinka Zitnik三人所著的文章《Building a knowledge graph to enable precision medicine》,文章发表于BioRxiv,他们三人分别来自哈佛麻省理工学院健康科学与技术项目组、斯坦福大学计算机科学系、哈佛大学生物医学信息学系。
DrugAI
2022-06-10
8850
Nat. Biotechnol. | CKG : 用于解释临床蛋白质组学数据的知识图谱
今日介绍的是Alberto Santos 最新发表在《自然生物技术》上的文章 ” A knowledge graph to interpret clinical proteomics data”. 针对生物医学数据数量大、种类丰富而带来的数据整合困难,该工作提出了一个开源的临床知识图谱平台CKG(Clinical Knowledge Graph), 该平台结合了统计和机器学习算法,加速了典型蛋白质组学工作流程的分析和解释。相比于其他解决方案,CKG平台显得更加友好,将一系列数据库和科学文献信息与omic数据整合到一个易于使用的工作流中,显著增强了科学研究和临床实践的能力。
DrugAI
2022-03-25
6500
bioRxiv | 生物学见解知识图谱(BIKG)助力药物开发
大家好!本文给大家介绍来自阿斯利康的AI工程总监Eliseo Papa带领的研究团队发表在bioRxiv的一篇文章“Biological Insights Knowledge Graph: an integrated knowledge graph to support drug development”。文中提出了一个新的知识图谱——Biological Insights Knowledge Graph (BIKG),它充分结合了来自公开数据源和阿斯利康企业内部数据源的相关数据,能够为一系列任务(从新靶点的识别,到现有药物的再利用)提供洞察力。本文描述了实现BIKG图的主要设计选择,并讨论了其从图的构建到开发的生命周期的各个方面。
DrugAI
2021-12-29
8450
MDNN: 一种用于药物-药物反应预测的多模态深度神经网络
今天介绍的是中南大学高建良团队和他人合作发表在IJCAI2021上的一篇文章“MDNN: A Multimodal Deep Neural Network for Predicting Drug-Drug Interaction Events”。本文指出许多基于人工智能的技术已经被提出并用于预测药物-药物反应(DDI),而现有的研究方法较少关注DDI与靶标、酶等多模态数据之间的潜在相关性。为了解决这一问题,作者提出了一个用于DDI预测的多模态深度神经网络(MDNN)。本文设计了一个基于药物知识图谱(DKG)的通道和基于异质特征(HF)的通道的双通道框架来获取药物的多模态表征。最后,通过一个多模态融合神经层来探索药物多模态表征之间的互补关系。作者在真实数据集上进行了广泛的实验。结果表明,MDNN能够准确预测DDI,并优于现有的模型。
DrugAI
2021-09-17
1.5K0
Bioinformatics | CLEP:用于生成患者表征的混合数据和知识驱动框架
今天给大家介绍由弗劳恩霍夫算法与科学计算研究所、波恩大学的Vinay Srinivas Bharadhwaj主导,多个机构合作发表在Bioinformatics上的一篇文章“CLEP: a hybrid data- and knowledge-driven framework for generating patient representations”。作者提出了患者的临床嵌入(CLinical Embedding of Patients,CLEP),一种利用先验知识和患者水平数据来生成新的患者表征的新方法。与使用原始转录组数据相比,使用由CLEP生成的新患者表征显著提高了各种机器学习模型在患者和健康对照之间进行分类的性能。
DrugAI
2021-08-24
5280
ICML2020 | 基于贝叶斯元学习在关系图上进行小样本关系抽取
今天给大家介绍来自加拿大蒙特利尔大学Mila人工智能研究所唐建教授课题组在ICML2020上发表的一篇关于关系抽取的文章。作者利用全局关系图来研究不同句子之间的新关系,并提出了一种新的贝叶斯元学习方法。该方法能够有效的学习关系原型向量的后验分布,并利用图神经网络参数化初始先验分布,并使用随机梯度Langevin动力学优化原型向量后验分布。最后实验表明,本文方法要优于目前小样本关系抽取模型的性能。
DrugAI
2021-02-02
6930
RNNLogic:知识图谱推理的逻辑规则学习
今天为大家带来蒙特利尔大学Yoshua Bengio最近的一篇文章。文章提到解决知识图谱推理任务时,逻辑规则的重要性。但是现有方法或面临搜索空间过大的问题,或由于稀疏奖励而使得性能较差。为了解决这些限制,作者提出了一个概率模型RNNLogic。
DrugAI
2021-02-02
4.2K0
ACL-BioNLP 2020 | 耶鲁大学实践成果:生物医药知识图谱嵌入模型基准测试
今天给大家介绍的是耶鲁大学医学信息学中心主任Brandt教授实验室和爱丁堡大学的博士生联合发表在ACL-BioNLP 2020发表的文章“Benchmark and Best Practices for Biomedical Knowledge Graph Embeddings”。作者将五个KGE模型应用到SNOMED-CT知识图谱中,提供了与现有方法的比较基准并深入讨论目前的最佳实践应用,并说明了利用知识图谱的多关系特性来学习生物医学知识表示的重要性。
DrugAI
2021-02-02
1.2K0
ACL2020 | 基于正交关系转换与图上下文建模的知识图嵌入
今天给大家介绍京东AI研究院的研究人员发表在ACL2020上的一篇文章。文章提出了一种新的基于距离的知识图谱链接预测方法,正交变换嵌入法(orthogonal transform embedding ,OTE),可以提高在1-N ,N-1和N-N的复杂链接预测情况下的精度,实验表明其可以在FB15k-237和WNRR-18两种常用数据集中取得较好的效果。
DrugAI
2021-02-02
6620
Bioinformatics | GraphDTA: 基于图卷积网络预测药物-靶标结合亲和力
现有的高通量筛选实验用于确定药物和靶标之间的生物活性是一个昂贵费时的步骤。因此,基于已经在临床实验中测量的相互作用,使用统计学和机器学习模型来估计新的药物-靶标的相互作用的强度是重要的替代方案。澳大利亚Deakin大学的Svetha Venkatesh课题组提出了GraphDTA,一种基于图神经网络的药物-靶标结合亲和力的预测方法。
DrugAI
2021-02-01
1.5K0
NeuIPS|在知识图谱上嵌入逻辑查询
今天为大家带来斯坦福大学Jure Leskovec教授课题组发表在NeuIPS上的一篇论文。本文引入了一个框架GQE,以便在不完整的知识图谱上有效地对合取逻辑查询进行预测。在本文的方法中,作者在低维空间中对图节点进行嵌入,并在这个嵌入空间中将逻辑运算符表示为学习过的几何运算(例如平移、旋转)。本文通过在低维嵌入空间中执行逻辑运算,实现了线性时间复杂度的变量查询。
DrugAI
2021-02-01
6240
IJCAI2020 | 知识图神经网络预测药物与药物相互作用
今天给大家介绍的是湖南大学信息科学与工程学院全哲教授课题组在IJCAI 2020会议上发表的一篇关于知识图神经网络预测药物与药物相互作用的文章。在本文中,作者提出了一个称为知识图神经网络(KGNN)的端到端框架,以预测药物与药物相互作用(DDI)。KGNN框架可通过在知识图谱(KG)中挖掘与药物关联的实体关系,以有效地获取药物及其潜在的邻居实体信息。为了提取KG中存在的高阶拓扑结构和语义关系,KGNN从KG中每个实体的邻域中学习作为它们的局部感知域,然后将当前实体表示的偏差及其邻域信息进行聚合。这样,可将感知域自然地扩展到多个跃点,以对高阶拓扑信息进行建模并获得潜在的长距离药物相关性。
DrugAI
2021-02-01
7600
K-BERT | 基于知识图谱的语言表示模型
今天给大家介绍发表在AAAI 2020上的文章“K-BERT: Enabling Language Representation with Knowledge Graph”,该工作由清华大学Weijie Liu等人完成。文章提出将知识图谱与预训练语言表示模型BERT相结合,使机器在阅读特定领域文本时,能够利用相关领域知识进行推理。
DrugAI
2021-02-01
1.3K0
点击加载更多
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档