一论文题目:
TRAPID 2.0: a web application for taxonomic and functional analysis of de novo transcriptomes 论文摘要:
高通量测序的进步导致 RNA-Seq 转录组数据的大量增加。然而,在特定组织、条件、单细胞生物或微生物群落中快速基因表达谱的前景带来了新的计算挑战。由于解析良好的参考基因组的可用性有限,de novo组装(元)转录组已成为研究以前未表征生物的基因库的流行工具。然而,尽管它们具有潜力,但这些数据集通常包含碎片或污染物序列,并且它们的分析仍然很困难。为了缓解其中一些挑战,作者开发了 TRAPID 2.0,这是一个用于快速高效处理组装转录组数据的 Web 应用程序。初始处理阶段对输入数据进行全局表征,为每个转录本提供多层注释,包括结构、功能和分类信息。探索阶段支持从 Web 应用程序进行下游分析。可用的分析包括基因空间完整性的评估、转录子集的功能分析和比较、以及在进化背景下研究转录本。与类似工具的比较突出了 TRAPID 的独特功能。最后,在 TRAPID 2.0 中进行了可视化。
论文链接:
https://academic.oup.com/nar/article/49/17/e101/6312746?searchresult=1 代码链接:
https://github.com/VIB-PSB/trapid.
二论文题目:
CoCoNet—boosting RNA contact prediction by convolutional neural networks
论文摘要:
共同进化模型,如直接耦合分析(DCA)和基于深度神经网络的机器学习(ML)技术相结合,能够预测准确的蛋白质接触图或距离图。这些信息可以作为结构预测的约束条件,大大提高预测精度。不幸的是,同样的ML方法不能很容易地应用于RNA,因为它们依赖于只适用于蛋白质的大型结构数据集。在这里,作者提出了如何使用现有的较小的RNA数据来改进RNA接触图的预测,介绍了一种基于协同进化模型和浅卷积神经网络相结合的CoCoNet算法。尽管该方法简单,训练参数少,但通过对大约80个RNA结构的交叉验证,预测接触的阳性预测值(PPV)相对于DCA提高了约70%。然而,在3D建模工具中直接包括CoCoNet触点并不会导致3D RNA结构预测精度的成比例增加。因此,作者建议该领域除了联系PPV外,还应开发更好地评估3D结构建模工具预期影响的度量标准。
论文链接:
https://doi.org/10.1093/nar/gkab1144
Github:
https://github.com/KIT-MBS/coconet
三论文题目:
Deeplasmid:深度学习准确地将质粒与细菌染色体分离
论文摘要:
质粒是可移动的遗传元件,通过介导重要基因(如抗菌素抗性基因)的水平转移,在微生物生态学和进化中发挥关键作用。许多微生物基因组已通过短读长测序仪进行了测序,并产生了源自质粒或染色体的重叠群的混合。需要准确识别质粒的新工具来阐明具有高度生物学重要性的新的质粒携带基因。作者开发了 Deeplasmid,这是一种深度学习工具,可根据 DNA 序列及其编码的生物数据区分质粒和细菌染色体。它只需要由任何测序平台和组装算法生成的组装序列作为输入,其运行时间与组装序列的数量成线性比例。Deeplasmid 实现了超过 89% 的 AUC-ROC,并且比其他五种质粒分类方法更准确。casestudy中使用深质粒来预测鱼类病原体中的新质粒没有带注释的质粒的鲁氏耶尔森氏菌ATCC 29473。深质粒以高可靠性预测长组装的重叠群是质粒的一部分。使用长读长测序,我们确实验证了 102 kb 长质粒的存在,证明了深质粒检测新质粒的能力。
论文链接:
https://academic.oup.com/nar/advance-article/doi/10.1093/nar/gkab1115/6454267
代码链接:
https : //github.com/wandreopoulos/deeplasmid
四论文题目:
Chewie Nomenclature Server (chewie-NS): a deployable nomenclature server for easy sharing of core and whole genome MLST schemas
论文摘要:
Chewie命名服务器(chewie-NS,https://chewbbaca.online/)允许用户共享基于基因组的逐个基因分型方案,并维护通用命名法,从而简化了结果比较。本地分析与等位基因数据的公共存储库的结合在潜在的保密性问题和比较结果的需求之间取得了平衡。部署chewie-NS私有实例的可能性有助于创建具有受限用户群的命名服务器,从而允许遵守最严格的数据策略。Chewie-NS允许用户轻松共享他们自己的架构,并浏览公开可用的架构,包括在交互式图表和表格中提供的有关架构和场所的信息统计。用户可以检索在本地运行模式所需的所有信息,也可以检索在特定位置识别的所有等位基因。与chewBBACA套件的集成使用户可以直接将新的架构上载到chewie-NS,下载现有架构并从chewBBACA命令行版本同步本地和远程架构,从而可以更轻松地集成到高通量分析管道中。链接chewie-NS和chewBBACA套件的相同REST API支持其他接口或管道与chewie-NS上可用数据库的交互,从而促进了存储数据的可重用性。允许更轻松地集成到高通量分析管道中。链接chewie-NS和chewBBACA套件的相同REST API支持其他接口或管道与chewie-NS上可用数据库的交互,从而促进了存储数据的可重用性。允许更轻松地集成到高通量分析管道中。链接chewie-NS和chewBBACA套件的相同REST API支持其他接口或管道与chewie-NS上可用的数据库的交互,从而促进了存储数据的可重用性。
论文链接:
https://academic.oup.com/nar/article/49/D1/D660/5929238?searchresult=1
代码链接:
https://github.com/B-UMMI/Chewie-NS