首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
您找到你想要的搜索结果了吗?
是的
没有找到

如何在Ubuntu 16.04上使用Cassandra和ElasticSearch设置Titan Graph数据库

Titan是一个高度可扩展的开源图形数据库。图形数据库是一种NoSQL数据库,其中所有数据都存储为节点(nodes)和边(edges)。图形数据库适用于高度连接数据的应用程序,其中数据之间的关系是应用程序功能的重要部分,如社交网站。Titan用于存储和查询分布在多台机器上的大量数据。它可以使用各种存储后端,如Apache Cassandra,HBase和BerkeleyDB。在本教程中,您将安装Titan 1.0,然后配置Titan以使用Cassandra和ElasticSearch。Cassandra充当保存底层数据的数据存储区,而ElasticSearch是一个自由文本搜索引擎,可用于在数据库中执行一些复杂的搜索操作。您还将使用Gremlin从数据库创建和查询数据。

02

基于Transformer预训练的蛋白语言模型是无监督的蛋白质结构学习器

无监督接触预测 (Unsupervised Contact Prediction) 是在蛋白质结构测定和设计过程中揭示蛋白质物理、结构和功能约束的核心。几十年来,主要的方法是从一组相关序列中推断进化约束。在过去的一年里,蛋白质语言模型已经成为一种潜在的替代方法,但目前性能还没有达到生物信息学中最先进的方法。本文证明了Transformer的注意图 (Attention Map) 能够从无监督语言建模目标中学习蛋白质序列中各个残基之间的接触距离。我们发现,迄今为止已经训练过的最高容量模型已经优于当前最先进的无监督接触预测的工作流程,这表明过去这些繁琐的工作流程可以用端到端模型的单向传递工作流程来代替。

01
领券