前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >【Bioinformatics】四篇好文简读-专题14

【Bioinformatics】四篇好文简读-专题14

作者头像
智能生信
发布2022-05-23 08:36:57
5250
发布2022-05-23 08:36:57
举报
文章被收录于专栏:智能生信

论文题目:

scGraph: a graph neural network-based approach to automatically identify cell types 论文摘要:

在过去的十年里,单细胞技术在生物研究的革命中发挥着至关重要的作用,这加强了我们从单细胞水平上对细胞分化、发育和调控的理解。单细胞RNA测序(scRNA seq)是最常见的单细胞技术之一,它可以在一次实验中探测数千个细胞的转录状态。从scRNA-seq测量中识别细胞类型是一个关键问题。以往的研究大多直接以基因表达为输入,而忽略了全面的基因-基因相互作用。作者提出了scGraph,这是一种利用基因相互作用关系来提高细胞类型识别性能的自动细胞识别算法。ScGraph基于图神经网络来聚合相互作用基因的信息。在一系列实验中,作者证明了scGraph在细胞类型识别任务中的准确性,并优于八种比较方法。此外,scGraph自动从生物数据中学习基因相互作用关系,路径富集分析结果与之前的分析结果一致,为调控机制分析提供了新的见解。

论文链接: https://academic.oup.com/bioinformatics/advance-article/doi/10.1093/bioinformatics/btac199/6565313

论文题目:

Deep learning identifies and quantifies recombination hotspot determinants 论文摘要:

重组是有性生殖生物的基本遗传过程之一,在某些区域可能频繁地发生,称为重组热点。尽管已知几个因素(例如 PRDM9 结合基序)与热点有关,但它们对重组热点的贡献尚未量化,其他决定因素尚未找到。本文提出了一种基于深度学习和信号处理的计算方法 RHSNet,利用来自各种研究、种群、性别和物种的数据集,以纯数据驱动的方式识别和量化热点决定因素。RHSNet 在跨不同物种、性别和研究的多个数据集上有优于其他基于序列的方法的表现。除了能够准确识别热点区域和众所周知的决定因素,更重要的是,RHSNet 可以量化 PRDM9 结合基序、组蛋白修饰和 GC 含量之间关系中对重组热点形成有显着贡献的因素。进一步的跨性别、跨种群和跨物种研究表明,所提出的方法具有识别和量化进化决定基序的泛化能力和潜力。

论文链接:

https://doi.org/10.1093/bioinformatics/btac234 代码链接:

https://github.com/frankchen121212/RHSNet

论文题目:

DeepSec: a deep learning framework for secreted protein discovery in human body fluids 论文摘要: 研究表明,各种细胞和组织分泌到不同体液中的蛋白质可能是各种疾病的指示。由定性和定量分析技术支持的现代蛋白质组学研究在各种人体体液的蛋白质发现方面取得了巨大进展。然而,由于体液中存在大量蛋白质和多种修饰,以及主要蛋白质组学平台(例如质谱)的现有技术限制,不同的实验研究往往会产生很大的差异。作者开发了一个名为 DeepSec 的深度学习框架,用于识别 12 种人体体液中的分泌蛋白。DeepSec 采用端到端的基于序列的方法,其中构建了卷积神经网络来学习抽象序列特征,然后是具有全连接层的双向门控循环单元,用于蛋白质分类。实验结果表明,DeepSec 优于现有的主要用于血液蛋白质的最先进方法。为了说明如何将 DeepSec 应用于生物标志物发现研究,作者利用来自癌症基因组图谱的基因组学数据对肾癌进行了案例研究,并确定了 104 种可能的标志物蛋白。

论文链接:

https://doi.org/10.1093/bioinformatics/btab545

论文题目:

STonKGs: A Sophisticated Transformer Trained on Biomedical Text and Knowledge Graphs

论文摘要:

大多数生物医学知识存储在结构化数据库中或作为非结构化文本存储在科学出版物中。大量的信息导致了许多基于机器学习的生物应用程序使用通过自然语言处理 的文本或通过知识图嵌入模型 使用结构化数据。然而,基于单一模态的表示本质上是有限的。为了生成更好的生物知识表示,作者提出了 STonKG,这是一种在生物医学文本和知识图谱 (KG) 上训练的复杂transformer。这种多模态 Transformer 使用来自 KG 的结构化信息的组合输入序列和来自生物医学文献的非结构化文本数据来学习共享嵌入空间中的联合表示。首先,作者在由集成网络和动态推理组装器 (INDRA) 组装的知识库上对 STonKG 进行了预训练,该知识库由多个 NLP 系统从生物医学文献中提取的数百万个文本-三元对组成。然后,作者将 STonKG 与在八种不同分类任务中的任一模式(即文本或 KG)上训练的三个基线模型进行了基准测试,每个分类任务对应于不同的生物应用。结果表明,STonKGs 优于两个基线,尤其是在类别数量方面更具挑战性的任务上,将最佳基线的 F1 分数提高了 0.084。作者的预训练模型以及模型架构也可以适用于各种其他迁移学习应用程序。

论文链接:

https://doi.org/10.1093/bioinformatics/btac001

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2022-05-04,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 智能生信 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
NLP 服务
NLP 服务(Natural Language Process,NLP)深度整合了腾讯内部的 NLP 技术,提供多项智能文本处理和文本生成能力,包括词法分析、相似词召回、词相似度、句子相似度、文本润色、句子纠错、文本补全、句子生成等。满足各行业的文本智能需求。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档