2022年5月10日,四川大学计算机学院的章乐等人在Signal Transduction and Targeted Therapy杂志发表文章,整理和分析了人工智能在癌症靶点识别和药物发现中的应用进展。本文重点介绍其中靶点识别相关的内容。
【新智元导读】最新研究发现,包括人脑在内的生物网络结构之所以会具有层次,是为了减少网络连接点,从而提高网络连接效率。该研究不仅揭开了生物网络拥有层次的原因,还有助于促进未来人工智能和机器人领域研究如何演化出更复杂、智能的计算大脑。 很多生物网络都具有层次,比如基因、蛋白质、神经元和代谢系统。人脑也有不同的区域负责运动控制和和触觉感知,而负责运动控制和触觉质感的脑区又各自含有不同的子区域掌控不同的身体部位。 但为什么如此多的生物网络都演化出层次? 美国怀俄明大学和法国 INRIA 研究团队 Henok S.
今天要讲的是来自《nature communications》的文章《用NeDRex平台来识别疾病模块和药物再利用的医学网络》。该论文介绍了作者团队自主研发的一款基于网络的药物再利用和疾病模块发现的集成交互平台NeDRex。NeDRex集成了10个不同的数据源,支持构建异质生物网络, 挖掘疾病模块,针对疾病机制的药物优先级排序,以及统计验证。平台主要包含知识库NeDRexDB,应用软件NeDRexAPP和API接口NeDRexAPI。
From hairballs to hypotheses–biological insights from microbial
今天介绍厦门大学刘向荣老师团队在Briefings in Bioinformatics上发表的一篇综述论文,该论文首先介绍了应用在网络数据上的深度学习几种典型的模型,然后根据不同的生物网络数据分类,介绍了现有的实际研究和工作;最后对这篇文章提到的方法进行了总结和讨论。
Spatial Analysis of Functional Enrichment(SAFE),功能富集空间分析
WGCNA是一种从大量数据中挖掘module的算法,而这些module所包含的gene为一组表达模式类似或这说表达谱相似的基因,也就是相关或不相关。 而正相关还是负相关可以由WGCNA的参数进行设定,默认是既包括正相关又包括负相关。 相似的表达模式可能意味着 -1 tightly co-regulated -2 functionally related -3 members of the same pathway 和聚类有一定的相似,但更具有生物学意义。 WGCNA对基因间表达量的相关系数取n次幂,使得相关系数数值的分布逐渐符合无尺度分布,按gene表达模式进行分类,将模式相似的gene归一一个模块module,而不是一般的cluster,因此WGCNA得出的结果有更高的可信度。把几个模块筛选出来了,模块中的gene也就知道了,这样,可以用这些结果分析出更多的意义。 在co-expression 网络中,每一个gene在一个特定时间或空间的表达情况可以看成一个点node,可以通过计算任何两个gene间的相关系数可以得到gene间的表达情况。第i个和第j个gene的pearson相关系数,即表示两个gene的表达相似性。可以通过设定一个阈值来确定两个gene之间的表达谱是否相似。达到这个阈值了就认为它们之间是相似的。这种方式的缺点就是,假如定义了0.8,那么0.79和0.81就是两个不同的范畴了。WGCNA通过软阈值避免这一问题。 网络的数学名称是图,图论中每一个节点node有一个概念,那就是度degree,一个点的度指的是图中该点所关联的边数edge。 scale-free network特点是存在少数节点,具有明显高于一般点的度,也就是并不是平均分布,这些点称为hub,由少数hub与其它节点关联,构成真哥哥网络。这样的无尺度网络的节点读书与具有该度数的节点个数服从幂分布,这就为寻找最佳参数提供了理论依据。 进化的过程中,生物选择了这种网络有其进化意义。整个生物网络中,少数的关键性的gene执行主要功能,只要保证hub的完整性,整个生物网络就不会坍塌,那生命体系就不会受太大影响。 WGCNA的详细流程 WGCNA关键模块和hub基因筛选
今天给大家介绍华中科技大学人工智能与自动化学院Xueming Liu课题组、哈佛医学院Joseph Loscalzo团队和伦斯勒理工学院Jianxi Gao课题组合作发表在 Nature Communication上的一篇文章“Robustness and lethality in multilayer biological molecular networks”。作者构建了人体多层生物分子网络模型并提出了一个框架来理解基因、蛋白质和代谢物之间的相互作用如何决定一个异质生物网络的鲁棒性。
Knowledge-primed neural networks enable biologically interpretable deep learning on single-cell sequencing data
今天分享的是来自Bo wang、Gary D. Bader和Charles Boone实验室联合发表在《Nature Methods》上的论文《BIONIC:使用卷积的生物网络集成》。虽然很多数据构建的生物网络可用来映射细胞功能,但每种数据类型都有局限性。通过结合和自动加权输入信息来获得更准确和全面的基础生物特征,网络集合有望解决这些限制。作者提出了一种基于深度学习的网络集成算法,其中包含了一个图卷积网络框架。与现有的方法相比,此方法,即BIONIC,学习的特征包含更多的功能信息。BIONIC有无监督和半监督的学习模式,利用了可用的基因功能注释。BIONIC在输入网络的规模和数量上都是可扩展的,可以集成人类基因组多种规模的网络。为了证明BIONIC在识别新生物方面的有效性,作者从酵母的非必需基因谱中预测并通过实验验证了基础基因化学-遗传相互作用。
我们之前也有过一个专辑:《cytoscape十大插件》,详见:cytoscape十大插件之九 - 转录调控王者 iRegulon,而且在b站有配套视频操作演示,可以任意快进快退的学习它。
今天我们介绍2022年在圣母大学组织的一个网络生物学未来方向研讨会,本文由研讨会参与者合著,总结了研讨会的讨论,预计其将帮助塑造网络生物学未来计算和算法研究的短期和长期愿景。网络生物学是一个跨学科领域,集计算科学和生物科学于一体,对于深入理解细胞功能和疾病至关重要。该领域存在约20年,仍处于初级发展阶段。由于多种因素导致该领域发生了快速变化和出现了新的计算挑战,包括数据复杂性的增加和不同组织水平上多种数据类型的出现以及数据量的增长。这意味着该领域的研究方向也需要发展。因此,汇聚了网络生物学各个计算和算法方面的活跃研究者,以确定这个领域的紧迫挑战。讨论的主题包括:生物网络的推断和比较、多模态数据整合和异构网络、高阶网络分析、网络上的机器学习以及基于网络的个体化医学。
信息基因的选择是基因表达研究中的重要问题。基因表达数据的小样本量和大量基因特性使选择过程复杂化。此外,所选择的信息基因可以作为基因共表达网络分析的重要输入。此外,尚未充分探索基因共表达网络中枢纽基因和模块相互作用的鉴定。本文提出了一种基于支持向量机算法的统计学上基因选择技术,用于从高维基因表达数据中选择信息基因。此外,已经尝试开发用于鉴定基因共表达网络中的中枢基因的统计学方法。此外,还开发了差异中枢基因分析方法,以在案例与对照研究中基于它们的基因连接性将鉴定的中枢基因分组成各种组。基于这种提出的方法,已经开发了R包,即dhga(https://cran.rproject.org/web/packages/dhga)。在三种不同的农作物微阵列数据集上评估了所提出的基因选择技术以及中枢基因识别方法的性能。基因选择技术优于大多数信息基因的现有技术。所提出的中枢基因识别方法,与现有方法相比,确定了少数中枢基因,这符合真实网络的无标度属性原则。在这项研究中,报道了一些关键基因及其拟南芥直系同源物,可用于大豆中的铝毒性应激反应工程。对各种选定关键基因的功能分析揭示了大豆中铝毒性胁迫响应的潜在分子机制。
在互联网探索到Seeing Theory开始,感受到了数据可视化对于知识展示的魅力,它能够把令人眼花缭乱的数据以舒服的交互以及视觉效果呈现给学习者。
今天为大家介绍的是美国研究组合作发表在Bioinformatics上的一篇文章“SumGNN: multi-typed drug interaction prediction via efficientknowledge graph summarization”。在这项工作中,作者整合了DDI信息以及生物医学KG数据,并提出了有效的聚合机制以进行DDI预测。实验结果表明,该模型具有良好的预测性能。
Deep fusion learning facilitates anatomical therapeutic chemical recognition in drug repurposing and discovery
本文介绍由亚马逊的研究团队推出的应用于生命科学的图神经网络指南《Graph Neural Networks in Life Sciences: Opportunities and Solutions》,这个工作发表在2022年数据挖掘顶会KDD上。图结构数据在生命科学以及医疗场景无处不在,最近很多研究把原来依赖于描述性数据分析的问题转化成依赖于生物网络的问题,例如图神经网络 (GNNs)。与其它领域相比,生命科学的问题有其自身的独特性和细微的差别。首先,这份指南比较全面地介绍了生命科学中的各种图结构数据,基于这些数据的生物和医学问题,以及相关的基于图机器学习的算法;随后,作者提供了四类基于GNN的解决方案的编程指南,每一种方案都提供了python代码和比较详细的说明,这四类问题包括:1)小分子属性预测;2)大分子属性和功能预测;3)基于双图(bi-graph)的蛋白质-配体对亲和力预测;4)利用知识图谱进行医学预测。所有代码都基于深度学习库DGL-lifesci和DGL-KE。
@He-Kai-fly - 深度学习就是用统计学从数据中找到隐藏规律,并且都是建立在大量数学运算的情况下,其中一部分都建立在统计学的基础上但又不完全是。
今天给大家介绍来自斯坦福大学的Bo Wang等人发表在Nature Communications上的文章,文章提出了一种基于随机游走的扩散方法Network enhancement(NE),并将其用于网络去噪,可以提高无向加权网络信噪比,通过实验表明,与其他去噪算法相比有更高的性能,可以广泛应用于生物网络去噪。
大家好,这次给大家分享一篇2020年3月发表在J. Cell. Physiol杂志上的文章,影响因子4.522。同样是非癌症类的文章,重点研究成骨细胞分化中起到功能性作用的lncRNA。
Link: https://microbiomejournal.biomedcentral.com/articles/10.1186/s40168-020-00857-2
Self-supervised graph representation learning integrates multiple molecular networks and decodes gene-disease relationships
你可能听说过图卷积,因为它在当时是一个非常热门的话题。虽然不太为人所知,但网络传播是计算生物学中用于网络学习的主要方法。在这篇文章中,我们将深入研究网络传播背后的理论和直觉,我们也将看到网络传播是图卷积的一种特殊情况。
作者 | Remy Lau 本文转载自CSDN博主「deephub」 你可能听说过图卷积,因为它在当时是一个非常热门的话题。虽然不太为人所知,但网络传播是计算生物学中用于网络学习的主要方法。在这篇文章中,我们将深入研究网络传播背后的理论和直觉,并将看到网络传播是图卷积的一种特殊情况。 网络传播是计算生物学中基于内疚关联原理的一种流行方法。 两种不同的网络传播观点:随机游走和扩散,以HotNet2为例。 网络传播是图卷积的一种特例。 计算生物学中的网络传播 网络自然产生于许多真实世界的数据,如社交网络,交
本文为《Artificial Intelligence in Drug Design》一书第7章的主要内容,作者是英国生物技术公司E-Therapeutics的Jonny Wray和Alan Whitmore。
Link:https://www.ncbi.nlm.nih.gov/pmc/articles/PMC7329523/
研究人员已经开发出一种使用深度学习来识别与疾病相关基因的人工神经网络。该研究发表在2020年2月12日《 Nature Communications》上。
我们的世界由复杂的微生物群落构成,这些微生物群落不仅仅是独立个体的集合,更是相互连接的生态群落复合体,这些生态群落会互相交流、共同生存和进化。微生物群的相互作用不仅限于微生物群落之间,还存在于微生物和它们的宿主之间,已有许多研究表明他们在宿主的发育、代谢、体内平衡和免疫中起着关键作用。虽然健康人的微生物组也十分多变,但研究发现微生物群落组成的失衡与不良的宿主反应有关,有时还与严重的病理反应有关,例如,腹泻、糖尿病、结肠直肠癌、炎症性肠病、肠易激综合征和肥胖症等等。
我们知道,图卷积(graph convolution )是AI算法中主流的网络学习方法,而网络传播(network propagation)是计算生物学中的主流方法,那么,二者有何密切联系和区别?在这篇文章中,作者通过深入研究网络传播背后的理论机制,发现网络传播其实是图卷积的一个特例。
肿瘤内异质性(ITH)出现在肿瘤进展、转移和复发的不同阶段,而这些对于临床应用是重要的。我们使用来自肿瘤样品的RNA测序数据,并根据生物网络状态测量ITH水平。为了模拟基因之间的复杂关系,我们使用蛋白质相互作用网络来考虑基因 - 基因关系。通过使用两个网络nJSD与JSD之间的基于熵的距离度量来测量ITH。使用nJSD,我们定义了基于转录组的ITH(tITH)。使用真实的生物数据集对与ITH相关的问题进行了广泛的测试。研究人类癌细胞系数据和单细胞测序数据以验证我们的方法。然后,我们分析了TCGA泛癌6,320例患者。我们的结果与广泛使用的基于基因组的ITH推断方法一致,ITH在生存分析中表现出很好的性能。对小鼠克隆进化数据的分析进一步证实,我们的基于转录组的ITH与不同克隆进化阶段的遗传异质性一致。此外,我们发现细胞周期相关途径对克隆进化过程中增加网络异质性有显着贡献。我们相信所提出的基于转录组的ITH可用于RNA水平的肿瘤样品的异质性。
上文《微生物网络构建原理: SparCC, MENA, LSA, CoNet》提到了微生物数据由于存在双零问题,会使得相关性偏高。
今天为大家介绍的是剑桥大学CaoXiao等人发表在Bioinformatics上的文章“SumGNN: 基于高效知识图总结的多类型药物相互作用预测”。由于药物-药物相互作用(DDI)数据集和大型生物医学知识图(KGs)的不断增加,使用机器学习模型准确检测不良的DDI成为可能。然而,如何有效地利用生物医学大噪声KGs进行DDI检测仍是一个有待解决的问题。此外,以往的研究多集中于二值DDI预测,而多型DDI的药理作用预测更有意义,但任务更艰巨。为了填补空白,作者提出了一种新的方法SumGNN: 知识摘要图神经网络。这个网络是通过子图提取模块实现的,该子图提取模块可以有效地锚定KG中的相关子图,从而在子图中生成推理路径,以及多通道知识和数据集成模块,该模块利用大量外部生物医学知识,显著改善了多类型DDI的预测。SumGNN比最佳模型的性能高出5.54%,在低数据关系类型中性能提高尤其显著。此外,SumGNN通过为每个预测生成的推理路径提供可解释的预测。
摘要 系统生物学的一个关键挑战是阐明决定细胞表型的基本原理或基本定律。了解如何在癌症等疾病中改变这些基本原则对于将基础科学知识转化为临床进展非常重要。虽然正在取得重大进展,但通过系统生物学方法确定了新的药物靶点和治疗方法,我们仍然缺乏基本系统对某些治疗成功和其他治疗失败的理解。我们在此提倡一种新的方法框架,用于系统分析和解释分子基因数据,这是基于统计力学原理。具体而言,我们提出了细胞信号熵(或不确定性)的概念,作为一种新的手段 分析和解释基因数据,更重要的是,作为阐明基础生物学和疾病基础的系统级原则的一种手
宾夕法尼亚大学精神病学系的Satterthwaite等人在Current Biology期刊上发表了一项研究,用来解释青年时期的执行功能活动和大脑结构网络的成熟过程。 摘要 在儿童和青少年时期,人类的大脑已经显现出大尺度的功能模块。然而,在功能执行的过程中,白质结构是否在成长过程中有类似的细化,仍然是未知的。研究者在费城神经发育中心的882的参与者(8-22岁)弥散成像中,展示了随着年龄的增长,脑网络的模块之间更加的分离,模块内部的连接不断增强。模块结构的提升能够有效增强脑网络联系的效率,并且,在模块内或者
其实转录组走到现在我总觉得少了点什么东西,后来才想起来是cytospace寻找hub基因
面向单细胞的技术革命,让我们得以进入新的研究层面,但也对传统的分析方法提出了一系列的挑战。单细胞技术正在弥补分子生物学和组织生物学之间的鸿沟,进入高通量时代以来,这项技术所揭示的不是单一元素的信息,而是在单细胞层面揭示某种系统关系:DNA,RNA,ATAC等。我们知道,在系统中,关键要素除了来自元素本身(基因,转录本等生物小分子)之外,还来自元素之间的关系。虽然作为领域起源的社会网络分析可以追溯到20世纪30年代,图论可以上溯几个世纪,但网络科学的迅速崛起与普及只是近几十年的事情。目前,基因调控网络,生物代谢与信号转导网络,蛋白质互作网络作为基本的生物分子网络(Biological molecular network )已经在生物信息分析中得到广泛的应用。
The BioGRID interaction database: 2019 update
在生物医学和生物信息学领域,PRC 和 AUPRC 有着非常广泛的应用。然而,常用的计算工具本身存在的问题可能会被研究人员忽略,从而可能导致对结果解读的偏差。2024 年 5 月,香港中文大学曹沁研究助理教授与徐国荣教授、美国SBP研究所Kevin Yip教授在 Genome Biology 上发表了一篇题为《Commonly used software tools produce conflicting and overly-optimistic AUPRC values》的文章,比较了常用软件工具在基因组学研究中的计算结果,发现产生的 AUPRC 值之间存在冲突和过度乐观的情况。研究人员在使用这些工具评估和解释基因组学研究结果时,需要谨慎,避免可能的误导性结果和偏见。
2022年在圣母大学组织的关于网络生物学未来方向的研讨会上,生物网络的推理和比较作为重要的研究方向,越来越多的被用于标记物的筛选与分子机制的研究。最近比较火热的viper实现单细胞蛋白活性推断,也是基于ARACNE算法构建的调控网络。
Introducing the Dendrify framework for incorporating dendrites to spiking neural networks
今天给大家介绍由中国科学院大学Lifei Wang等人在《nature machine intelligence》上发表了一篇名为“An interpretable deep-learning architecture of capsule networks for identifying cell-type gene expression programs from single-cell RNA sequencing data”的文章。文中提出了一个使用胶囊网络(称为scCapsNet)的可解释的深度学习体系结构。胶囊结构(代表一组特定对象属性的神经元向量)捕捉层次关系。通过利用竞争性单细胞类型识别,scCapsNet模型能够进行特征选择以识别编码不同亚细胞类型的基因组。将RNA表达特征有效地整合到scCapsNet的参数矩阵中,实现了亚细胞类型识别。
今天为大家介绍的是来自杨光富团队的一篇论文。蛋白质-蛋白质相互作用(PPIs)对于多种细胞性过程至关重要,为药物靶点发现提供了一个有前景的途径。PPIs的特征是多层次的复杂性:在蛋白质层面,可以利用相互作用网络来识别潜在的靶点;而在残基层面,可以利用单个PPIs的相互作用细节来检查一个靶点的可药性。在通过多层次PPI相关的计算方法进行靶点发现方面,已经取得了巨大的进展,但这些资源尚未得到充分讨论。在这里,作者系统地调查了用于识别和评估潜在药物靶点的生物信息学工具,检查它们的特性、限制和应用。这项工作将帮助将更广泛的蛋白质到网络的上下文与详细的结合机制分析相结合,以支持药物靶点的发现。
复杂性是被低估的。复杂越高,开发人员会感到不安。对其的理解认知负荷代价就越高,我们就更不快乐。真正的挑战是在构建我们的系统时要保持其有序以及工程师的生产方式。对于这一点,一个简单的物理规律可以帮助我们:构造定律 the Constructal Law.
我在上学的时候非常讨厌生物学,却热爱数学。在经过很长一段时间之后,我现在终于开始接触一个将数学和生物学结合在一起的领域:受生物神经网络启发而诞生的人工神经网络(ANN)。虽然你可能会觉得这样说很奇怪,但这就是我对人工神经网络的定义。我们在这里所谈的生物学,基本上是研究大脑或者神经系统。人工智能模仿神经系统如何工作。由于大数据的加持,人工神经网络最近非常受欢迎。事实上,我的一个同事说,如果没有大数据,你无法完成人工神经网络或任何机器学习算法。但当然,我不相信他并决定亲自试一试。所以,这篇博文是我与人工智能的第一次互动。
AI 要通过具身图灵测试,必须与世界互动、具有灵活性、提高能源效率。 作者 | AI 科技评论 编辑 | 陈彩娴 历史上,神经科学一直是人工智能发展的关键驱动力和灵感来源,特别是视觉、基于奖励的学习、与物理世界的互动以及语言等人类和其他动物非常擅长的领域,人工智能曾借助神经科学在这些领域取得长足进步。 但近年来,人工智能的研究方式似乎正在远离神经科学,与此同时,人工智能在追赶人类智能的路上困难不断。在此背景下,一股回归神经科学的人工智能热潮正在形成。 近日,一份白皮书发出了“NeuroAI 将催化下一代人工
2021年2月,来自复旦大学、清华大学深圳国际研究生院、深圳华大生命科学研究院等多机构科研团队共同在《Microbiome》杂志上发表文章“Characterization of the human skin resistome and identification of two microbiota cutotypes”,揭示中国汉族人群皮肤微生态宏基因组特征,为进一步探索皮肤微生物功能、利用皮肤微生物改善皮肤状态提供了理论基础。
「长期以来,神经科学一直是人工智能进步的重要驱动力。我们提议,为了加速人工智能的进展,必须投资于 NeuroAI 的基础研究。」
大数据文摘授权转载自AI科技评论 作者 | AI 科技评论 编辑 | 陈彩娴 历史上,神经科学一直是人工智能发展的关键驱动力和灵感来源,特别是视觉、基于奖励的学习、与物理世界的互动以及语言等人类和其他动物非常擅长的领域,人工智能曾借助神经科学在这些领域取得长足进步。 但近年来,人工智能的研究方式似乎正在远离神经科学,与此同时,人工智能在追赶人类智能的路上困难不断。在此背景下,一股回归神经科学的人工智能热潮正在形成。 近日,一份白皮书发出了“NeuroAI 将催化下一代人工智能革命”的宣言。 这份以“Tow
Motivation: 目前一些计算方法都是基于2011年的那个ceRNAs假设,研究lncRNAs和miRNA靶mRNAs之间的竞争关系。但是,当mRNAs脱离miRNAs的控制之后,海绵lncRNAs如何影响这些mRNAs的表达水平还不是很清楚。
@NiEntropy - 想到了生物课本中的一句话:生物的性状是由基因决定的,而基因的表达受环境因素影响;想到了秦始皇炼丹渡海寻仙求长生,Google投资Calico专注衰老研究。从古至今,人类一直在追寻着长寿,而在日复一日的生活中,我更感兴趣未来会是什么样?是像《赛博朋克:边缘行者》中“低端生活与高等科技结合”的悲剧,还是我们共同的理想:在高度发达的社会生产力和广大共识范围,人们科学文化水平和思想觉悟,道德水平极大提高的基础上,实行各尽所能、按需分配原则的劳动者有序自由联合的社会经济形态。未来源于当下,还是要脚踏实地把当下的工作干好。
领取专属 10元无门槛券
手把手带您无忧上云