首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
您找到你想要的搜索结果了吗?
是的
没有找到

JanusGraph -- 简介

图数据库的基本含义是以“图”这种数据结构存储和查询数据,而不是存储图片的数据库。它的数据模型主要是以节点和关系(边)来体现,也可处理键值对。它的优点是快速解决复杂的关系问题。 图将实体表现为节点,实体与其他实体连接的方式表现为联系。我们可以用这个通用的、富有表现力的结构来建模各种场景,从宇宙火箭的建造到道路系统,从食物的供应链及原产地追踪到人们的病历,甚至更多其他的场景。 图形数据库是NoSQL数据库的一种类型,它应用图形理论存储实体之间的关系信息。最常见的例子,就是社会网络中人与人之间的关系。关系型数据库用于存储关系型数据的效果并不好,其查询复杂、缓慢、超出预期,而图形数据库的独特设计恰恰弥补了这个缺陷。 目前主流的图数据库有:Neo4j,FlockDB,GraphDB,InfiniteGraph,Titan,JanusGraph,Pregel等。下面说一下JanusGraph 官网上:

01

如何在Ubuntu 16.04上使用Cassandra和ElasticSearch设置Titan Graph数据库

Titan是一个高度可扩展的开源图形数据库。图形数据库是一种NoSQL数据库,其中所有数据都存储为节点(nodes)和边(edges)。图形数据库适用于高度连接数据的应用程序,其中数据之间的关系是应用程序功能的重要部分,如社交网站。Titan用于存储和查询分布在多台机器上的大量数据。它可以使用各种存储后端,如Apache Cassandra,HBase和BerkeleyDB。在本教程中,您将安装Titan 1.0,然后配置Titan以使用Cassandra和ElasticSearch。Cassandra充当保存底层数据的数据存储区,而ElasticSearch是一个自由文本搜索引擎,可用于在数据库中执行一些复杂的搜索操作。您还将使用Gremlin从数据库创建和查询数据。

02

基于Transformer预训练的蛋白语言模型是无监督的蛋白质结构学习器

无监督接触预测 (Unsupervised Contact Prediction) 是在蛋白质结构测定和设计过程中揭示蛋白质物理、结构和功能约束的核心。几十年来,主要的方法是从一组相关序列中推断进化约束。在过去的一年里,蛋白质语言模型已经成为一种潜在的替代方法,但目前性能还没有达到生物信息学中最先进的方法。本文证明了Transformer的注意图 (Attention Map) 能够从无监督语言建模目标中学习蛋白质序列中各个残基之间的接触距离。我们发现,迄今为止已经训练过的最高容量模型已经优于当前最先进的无监督接触预测的工作流程,这表明过去这些繁琐的工作流程可以用端到端模型的单向传递工作流程来代替。

01

Bioinformatics|利用进化概况、突变耦合和二维迁移学习改进了RNA二级结构和三级碱基配对预测

今天给大家介绍Jaswinder Singh等人在Bioinformatics上发表的文章”Improved RNA secondary structure and tertiary base-pairing prediction using evolutionary profile, mutational coupling and two-dimensional transfer learning”。最近发现的许多非编码RNA(特别是长非编码RNA)改变了我们对RNA在生物体中作用的看法,但是由于现有的实验技术无法有效地解决高分辨率的二级和三级结构,阻碍了我们对它们的理解。另一方面,通过对大量近似数据的深度学习,然后是对高分辨率三维结构的金标准碱基配对结构的迁移学习,对RNA二级结构的计算预测进行了急需的改进。本文将这种基于单序列的学习扩展到使用进化概况和突变耦合,不仅可以大大改进规范碱基对(RNA二级结构),而且可以进一步改进与三级碱基对相关的碱基对,如pseudoknots, non-canonical 和 lone 碱基对。特别的,本文模型对1000多个同源序列RNA预测非常精确,得到大于0.8的F1-score,本文通过结合没有任何修改的人工的,但功能相同的同源序列,显著提高了碱基配对预测。总体上来说,本文的全自动方法为科学界提供一个新的强大工具,不仅可以捕获二级结构,而且可以捕获用于构建三维模型的三级碱基配对信息,它还强调了通过使用大量的自然和/或人工同源序列来精确解决碱基配对结构的未来。

01

PointNet分享_1

这类方法首先在三维形状上提取手工特征, 进而将这些特征作为深度神经网络的输入,用以学习高层特征表示。其优势在于可以充分利用现有的低层特征描述深度学习模型。比如, Bu 等人首先将热核特征和平均测地距离等构成的低层特征通过 Bag-of-Feature 模型转化为中层特征,接着采用深度置信网络(DBN)从中层特征中学习高层特征表示, 并成功应用于三维形状检索与识别。 Xie 等人首先提取三维形状 Heat Kernel Signature 特征的多尺度直方图分布作为自编码机的输入,然后在每个尺度上训练一个自编码机并将多个尺度隐含层的输出连接得到特征描述子, 并在多个数据集上测试了该方法用于形状分类的有效性。这类方法的缺陷在于,其仍然依赖手工特征的选择与参数优化,因此在某种程度上损失了深度学习的优势,无法从根本上克服手工特征存在的问题。

01
领券