首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

基于图卷积神经网络分子距离矩阵预测

近年来,一些研究通过预测距离矩阵来重构原子坐标,得到分子几何结构[12-17]。这些研究大多采用概率生成模型,目的是生成多个低能量构象,但仍存在一定局限性。...此外,为了提高模型预测精度,我们在节点特征中加入全局信息(分子组成),特征采用五维特征,原子之间没有键特征是两个原子之间最短路径特征之和。...3.4 性质预测对比 为了表明所提方法有效性,我们使用文献[25]中方法,分别根据QM9数据集[20]计算出分子距离矩阵和我们方法预测分子距离矩阵来预测分子性质。...可以看出,基于我们模型预测分子距离矩阵得到性质预测结果(Predicted)与基于QM9数据集计算分子距离矩阵得到性质预测结果比较接近。...表6 使用QM9中原子距离矩阵和预测原子距离矩阵进行性质预测误差对比 4 结论 本章提出了一种基于图卷积网络双分支DMGCN模型,以解决传统计算方法在确定分子结构时实验成本高、计算成本高问题

1.3K30
您找到你想要的搜索结果了吗?
是的
没有找到

基于Transformer预训练蛋白语言模型是无监督蛋白质结构学习器

过去方法通常是通过对相关和对齐序列分析来利用蛋白质序列进化信息。 目前方法是使用类似于NLP中语言模型来捕捉序列中内在隐含性质。...潜在误差来源包括 预滤波启发式方法失效 相关序列未被检测到 未能找到最佳对齐 替代矩阵和间隙惩罚次优性,即找不到全局最优解 2.3 评估指标 对于长度为 蛋白质,我们评估了长度为前 、...作者在具有15051个蛋白质trRosetta训练数据集中评估预训练蛋白质语言模型,其中在trRosetta数据集中去除了43个序列长度大于1024蛋白质,因为ESM-1b训练上下文大小设置为...作者发现,虽然ESM-1b模型只用了20个蛋白质序列进行训练,但其在短、中、远距离范围接触预测方面均比Gremlin具有更高精度。...作者发现,即便只有一个单一训练例子,ESM-1b在长度为L序列距离范围预测中,平均精度已经达到39.2,接近SOTA,相同情况下,这与Gremlin在统计学上已经是无法区分孰优孰劣了(假设检验

2.6K10

3. JanusGraph快速开始

Graph of the Gods 标示 含义 加粗key 图中索引键 加粗带星key 图中索引键值必须是唯一 带下划线key 以顶点为中心索引键 空心箭头 特定(不能重复) 尾部十字...Groovy构建在Java语言之上,具有很多简洁语法,使交互式编程变得更加容易。同样Gremlin-Groovy也是构建在Groovy之上,具有简洁语法,使得图遍历变得容易。...该起始点是一个元素(或一组元素) - 即顶点或。从起始点,Gremlin路径描述描述了如何通过显示图结构来遍历图中其他点。...JanusGraph会自动使用索引来检索满足一个或多个约束条件所有顶点(g.V)或(g.E)。JanusGraph中另外一种索引是以顶点为中心索引。以顶点为中心索引可以加快图遍历。...这也可以使用循环方式来查询,实际上Hercules是从Saturn在in('father') 路径上循环两次到达点。

3.3K20

图(graph) 原

3.ADT定义 如下是图抽象数据类型定义: ADT Graph{ 数据对象D:D是具有相同性质数据元素集合。...2>性质 邻接矩阵有如下特性: (1)图中各顶点序号确定后,图邻接矩阵是唯一确定。 (2)无向图和无向网琳姐矩阵是一个对称矩阵。...4>邻接表性质 邻接表性质如下: (1)图邻接表表示不是惟一,它与表结点链入次序有关。 (2)无向图邻接表中第i个结点个数即为第i个顶点度。...如果(u,v)是G中所有的一个端点在U(即u∈U)里,另一个端点不在U(即v∈V-U)里中,具有最小权值一条,则一定存在G一棵最小生成树包括此(u,v)。这个性质称为MST性质。...把v1放在vi到vj路径上,vi到vj之间可能会产生新路径,其距离为D(0)[i][1] + D(0)[1][j],当然v1引入可能反而会加大vi到vj距离,因此需要比较D(0)[i][1] +

1.8K20

CS224w图机器学习(一):Graph介绍、特性和随机图模型

表征(Representing Graph) Adjacency Matrix 图 邻接矩阵 是一个维度为 矩阵矩阵元素 代表节点 和节点 之间是否存在...现实中,图邻接矩阵非常稀疏,通常需要其他方法来表征。 Edge List list,存储图中所有边。如: 。...: 个节点组成无向图,一共存在 条随机分布 随机图性质 Degree Distribution 对于图中任意节点,它与其他所有节点之间存在概率为 图中所有节点...此时网络具有很高聚类系数,类似于每个人有100个朋友。 此时需要再对网络进行随机剪切和重组。 2)Rewire:随机给两个距离较远节点添加或删除。...image.png 小世界模型性质 如下图,横轴为rewire概率p,实线纵轴为平均最短路径长度,虚线纵轴为聚类系数。 随着rewire概率越大,聚类系数和平均路径长度越小。

1.6K30

知识图谱之图数据库如何选型:知识图谱存储与图数据库总结、主流图数据库对比(JanusGraph、HugeGraph、Neo4j、Dgraph、NebulaGraph、Tugrapg)

) RPQ 超集 (增加通过表达式比较属性值) RPQ 超集 (增加比较路径顶点和) RPQ 超集 (增加复杂路径表达式) 语义 任意路径、集合 4 无重复 5、包 2 任意路径 6、包 2 最短路径...Cypher 可通过 shortestPath 函数支持最短路径语义. 6. Gremlin 中其他语义可以被模拟出来. 7. PGQL 路径查询可通过用户定义函数实现其他语义. 8....(2) 对于一行来说,仅在极 少数列上具有值, 表中存在大量空值, 空值过多会影响表存储、索引和查询性能 (3) 在知识图谱中,同一主语 和谓语可能具有多个不同宾语,即一对多联系或多值属性,而水平表一行一列上只能存储一个值...Cayley 使用 Go 语言开发,可以作为 Go 类库使用;对外提供 REST API,具有内置查询编辑器和可视化界面;支持多种查询语言,包括:基于 Gremlin Gizmo、GraphQL...它是世界上能够托管具有数百亿个顶点(节点)和数万亿条(关系)图形最佳解决方案,具有毫秒级延迟。

2.4K11

eLife | 利用进化信息预测蛋白质界面间残基-残基相互作用

两个或多个蛋白质可以结合在一起,形成复合体来执行各种任务;研究这些复合物结构是一项挑战,即使是在已知蛋白质亚基结构情况下也是如此。...作者限制使用具有,保守基因间距离基因对来创建配对序列,以此规避旁系同源基因。相似的方法被用于构建原核基因组中融合蛋白数据库。...(5)用Gremlin评分排序残基对 为了将W ij矩阵简化为反映位置i和j之间耦合强度单个值,作者首先计算S ij,即它们向量2范数。...(6)将Gremlin评分转化成距离约束 作者将耦合强度转换为特定于残基对距离约束,并将其包括在Rosetta结构预测程序中。作者使用以下形式距离约束: ?...为了简化直系同源鉴定,关注基因组中具有保守染色体位置基因对,该基因对在基因组中被少于20个其他带注释基因隔开。然后,作者为配对蛋白质家族中序列建立Gremlin全局统计模型。

1.1K70

一文了解各大图数据库查询语言(Gremlin vs Cypher vs nGQL)| 操作入门篇

虽然 Gremlin 是基于 Groovy ,但具有许多语言变体,允许开发人员以 Java、JavaScript、Python、Scala、Clojure 和 Groovy 等许多现代编程语言原生编写...下面进入到相关语法内容类型 和点一样,也可以有对应类型# Gremlin 创建类型g.edgeLabel()# nGQL 创建类型CREATE EDGE edgeTypeName(propNameList...) CRUD说完类型应该进入到常规操作部分了插入指定边类型可以看到和点使用语法类似,只不过在 Cypher 和 nGQL 中分别使用 -[]-> 和 -> 来表示关系,而 Gremlin...图片# Gremlin 插入指定边类型g.addE(String edgeLabel).from(v1).to(v2).property()# Cypher 插入指定边类型CREATE (()WHERE conditionRETURN r# nGQL 沿指定点查询指定边 N 跳GO N STEPS FROM OVER 返回指定两点路径# Gremlin

10.7K21

单源最短路径问题(Java)

另外,还给定V中一个顶点, 称为源。现在要计算从源到所有其他各顶点最短路长度。这里路长度是指路上各权之和。这个问题通常称为单源最短路径问题。 其中,V表示顶点集合,E表示各个节点之间。...此为矛盾,因为如果(3)成立,此时应该选择 x进入S集合,即选择具有最短特殊路径顶点是x,而不是u。...(因为根据最短路径算法,总是选取最短路径顶点进入S) 4.2 最优子结构性质性质描述为:如果S(i,j)={Vi....Vk..Vs...Vj}是从顶点i到j最短路径,k和s是这条路径一个中间顶点...则与S(i,j)是从i到j最短路径相矛盾。因此该性质得证。...4.3 计算复杂性 对于具有n个顶点和e条带权有向图, 如果用带权邻接矩阵表示这个图,那么Dijkstra算法主循环体需要O(n) 时间。

51810

【地铁上面试题】--基础部分--数据结构与算法--树和图

1.2 树特点和性质 树(Tree)作为一种常见数据结构,具有以下特点和性质: 特点与性质 解释 非线性结构 树是一种非线性数据结构,与线性结构(如数组和链表)相对。...Tip:树特点和性质使其具有良好层级结构,适用于许多实际应用场景,如文件系统、数据库索引、组织结构等。...Trie树特点是每个节点代表一个字符,从根节点到叶节点路径表示一个字符串。 这些常见树结构在不同场景下具有不同应用和特点。...对于包含 N 个节点图,邻接矩阵是一个 N×N 矩阵矩阵元素表示节点之间连接关系,如果两个节点之间存在,则对应位置元素为 1 或权重值,否则为 0 或者其他特定表示。...矩阵元素表示节点与之间关联关系,通常使用 1 或 -1 来表示节点是起点或终点。关联矩阵适用于多重图(允许多个相同节点之间)或带有边属性图。

46190

Apache新顶级项目 TinkerPop

Apache软件基金会最近宣布:TinkerPop 升级为顶级项目 TinkerPop 是一个图计算框架,用来进行实时事务型处理,和批量图分析,包含了一系列以 Gremlin 引擎为核心子项目和模块...图是一种描述数据存储结构方式,比如键值对结构,也是存储数据一种方式,只是图结构更为复杂 图是由顶点和组成,点和各自都可以包含任意多个键值对形式属性 点是用来描述离散对象,例如 人、地点、...事件 是对点之间关系描述,例如,一个人可以认识另一个人、一个人参与了某件事、一个人在某个地方 属性描述了点和信息,例如,一个点包含属性:名称、年龄,一个包含属性:时间戳 点、、属性 就构成了一个图...图计算已经有了丰富历史,他有查询语言,和复杂算法,例如 路径分析、点类聚、排序、子图识别 …… 正是因为图具有灵活数据结构,并包含了丰富复杂算法,所以图结构被广泛应用于数据挖掘、数据分析 TinkerPop...TinkerPop 图处理引擎 Gremlin 非常强大,并支持非常多开发语言,例如 Python, JavaScript, Scala, Go,选择自己熟悉语言,即可运行图遍历处理 TinkerPop

1.5K50

图论入门——从基础概念到NetworkX

同样,还有对称归一化拉普拉斯矩阵和随机游走拉普拉斯矩阵等不同定义方式。 路径距离 在图论中,路径距离是描述图中节点之间连接关系和位置关系重要概念。...距离(Distance):在图中,两个节点之间距离是指连接这两个节点最短路径长度。如果两个节点之间没有路径相连,则它们之间距离通常被定义为无穷大。...= \frac{n \times (n-1)}{2} 图连通性 连通性描述是图中节点之间是否存在路径相连性质。一个图是连通,意味着从图中任意一个节点到另一个节点都存在路径。...,其应该具有更高高Fiedler值,表明要将图分割成孤立子图,需要切断更多。...这通常发生在图中存在一个或多个"瓶颈"区域,这些区域相对较少,是连接大图区域桥梁。

55210

Nat Commun|知识引导分子表示学习预训练框架

此外,为了精确建模分子结构信息,在多头注意模块中引入了两个位置编码模块,即距离编码模块和路径编码模块。...如图1b所示,由于直接应用经典Transformer架构会导致分子结构信息严重丢失,作者采用路径编码和距离编码模块将结构信息引入多头自注意层。...在分子线形图中,路径编码模块首先找到节点之间最短路径,然后将路径特征编码为一个注意力尺度。距离编码模块则利用节点对之间距离来进一步编码分子线形图空间特征。...最终注意力矩阵为原始注意力编码矩阵路径编码矩阵距离编码矩阵和。 如图1c所示,在本研究中,知识定义为表征分子特征任何可量化信息。...采用三折交叉验证(n=3),对于KNN中不同K值,KPGT在分类任务上具有最高AUROC和准确度(图3a),在对MolLogP等多个指标的回归预测中具有最高斯皮尔曼相关系数(图3b)。

14110

数据结构–图

以顶点x为弧头数目,称为x入度,记作ID(x)。 6.图连通性质 对无向图G: ● 若从顶点vi到vj有路径,则称vi和vj是连通。 ● 若图G中任意两顶点是连通,则称G是连通图。...2.图存储形式 1.数组表示法/邻接矩阵 顶点数组—用一维数组存储顶点(元素) 邻接矩阵—用二维数组存储顶点(元素)之间关系(或弧) 无向图邻接矩阵是对称由0-1构成 列和和行和都是i度...如果(u,v)是G中所有一端在U中(即u∈U)而另一端在V-U中(即v∈V-U)具有最小值一条,则必存在一棵包含(u,v)最小生成树。...这是B进入结点,遍历一遍B到每个结点距离,发现5<6,更新数据集,D邻接结点为B /* 邻接矩阵存储 - Prim最小生成树算法 */ Vertex FindMinDist( MGraph...如果结点只有一个前驱结点:那就是前驱结点ve+到这个结点多个前驱结点:前驱结点ve+到这求最大值 2.活动最早开始时间ee(e)=所连接弧尾标记值 3.

61640

Gremlin 图查询概述

RDF 由节点和组成,节点表示实体/资源、属性,则表示了实体和实体之间关系以及实体和属性关系。RDF 没有外键和主键,它使用是 URI,万维网标准引用格式。...查询本质是图遍历,擅长解决求图直径、点到点之间路径,比如刘德华连接奥巴马需要几度关系。...目前我们主要用Gremlin 语言是是 Groovy,语句类似这样: // 查询andy到jack四跳以内最短路径 g.V("andy") .repeat(both().simplePath())...但从另一方面来看,多个后端存储也带来了一些弊端: 我们就需要在软件架构进行抽象,增加一个可以适配多个存储数据格式(StaticBuffer),数据无论是写入还是读取,都需要先转化成中间格式,这里带来了序列化和反序列化一些性能损耗...JanusGraph 缺陷 由上面的存储和查询也可以看到,基于 Hbase属性图有下面几个明显缺陷: 顶点属性和存储在一行中,当点出入度越大时,属性查询耗时将会越大; 更新某一个属性时,需要先获取整个数据

4K10

Gremlin查询语言

Gremlin是JanusGraph查询语言,用于从图中检索数据和更新数据。 Gremlin是一种面向路径语言,它能够简洁地表示复杂图形遍历和多步操作。...Gremlin是一种函数式语言,遍历运算被链接在一起形成类似路径表达式。 例如,“从Hercules,遍历他父亲,然后他父亲父亲,并返回祖父名字。”...has('name', 'hercules'):过滤出顶点name为hercules顶点。 out('father'):从hercules顶点遍历出为father。...out('father'):从herculesfather顶点遍历出为father。 name:获取hercules祖父顶点name属性值。 总之,这些步骤构成了类似路径遍历查询。...鉴于神图形只有一个战斗者(Hercules),另一个战斗者(为了举例)被添加到图中,Gremlin展示了如何将顶点和添加到图形中。

3.6K20

数据结构与算法——最小生成树

连通图:在无向图中,若任意两个顶点与都有路径相通,则称该无向图为连通图。 强连通图:在有向图中,若任意两个顶点与都有路径相通,则称该有向图为强连通图。...连通网:在连通图中,若图具有一定意义,每一条都对应着一个数,称为权;权代表着连接连个顶点代价,称这种连通图叫做连通网。...与顶点A邻接有B、C,对应距离为6、3。与C邻接顶点有B、F、E,对应距离为4、7、8。由于顶点A、C均被标记,故不能选择距离为3路径。此时应选择距离最短(C,B)。...此算法是从最小生成树性质出发,通过构造权矩阵方式来得到图最小生成树。   设图G1是图G最小生成树,则G1具有如下性质:   (1)G1中各条权值之和最小。   ...(2)G1中有n个顶点n-1条。   (3)G1必须是连通且无回路。 6.1 算法流程   (1)根据图顶点数n以及各对应权值建立权矩阵A。矩阵A主对角线上元素A[i][i]为0。

1.5K30
领券