首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

ICLR 2022 under review|化学反应感知的分子表征学习

因此,作者提出使用化学反应来协助学习分子表征,其核心思想在于保持分子在嵌入空间中的化学反应的等价性,即强制让每个化学方程式的反应物嵌入和生成物嵌入的总和相等,该限制在保持嵌入空间的有序性和提高分子嵌入的泛化能力中被证明是有效的...在这项工作中,每个原子ai都有初始特征向量,该向量包括四个one-hot向量,每个one-hot向量表示一种原子属性,四个one-hot向量分别表示四种原子属性,分别为元素类型、电荷、原子是否是芳香环以及附着的氢原子数...,然后每个one-hot向量有一个额外的未知条目,以在推理过程中处理未知值。...GNN的第k层是: 这里,是原子ai在第k层的表征向量,N(i)是与ai相连的原子集合,K是GNN的层数,这个聚合函数的选择是设计GNN的关键。...惊讶的是,我们发现横轴与分子中最小环的数量有关:如图4d所示,没有环的分子(蓝色)仅存在于左簇中,含有一个环的分子(黄色)仅存在于左簇和中间簇中,含有两个环的分子(橙色)基本上位于中间簇,而右边簇主要由含有

81420

AI「反腐」,德国马普所结合 NLP 和 DNN 开发抗蚀合金

By 超神经 内容一览:在被不锈钢包围的世界中,我们可能都快忘记了腐蚀的存在。然而,腐蚀存在于生活中的方方面面。无论是锈迹斑斑的钢钉,老化漏液的电线,还是失去光泽的汽车,这一切的发生都与腐蚀有关。...因此,整型向量会经过向量化转换为 n 维浮点型向量。在训练过程中, 每个词汇的权重被不断优化。训练完成后,向量间的接近度则对应着它们的语义相似性。...特征变换 DNN 模型设计 通过合金组分特征化函数「WenAlloys」,合金的组分信息还可以被分解为一系列原子、物理及化学特性,并变换为不同的描述符,作为 DNN 模型的输入值。...特征变换 DNN 对 Al-Cu-Sc-Zr 合金的预测 由于特征变换 DNN 的输入中只有组分的原子、物理及化学特征,因此它可以对训练集中不存在的元素进行预测。...在多种合金中,Sc 和 Zr 元素都展现出了对抗蚀性能的提升。因此,研究团队利用特征变换 DNN 对这两种元素对 Al-Cu 合金的影响进行了分析。

26731
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    YJango:深度学习入门

    假想情景 \vec{x}是二维向量,维度是碳原子和氧原子的数量 [C;O],数值且定为[1;1]。若确定\vec{y}是三维向量,就会形成如下网络的形状 (神经网络的每个节点表示一个维度)。...也有最新研究表明在高维空间下局部极小值通常很接近全局最小值,训练网络时真正与之“斗争”的是鞍点。但不管是什么,其难处就是loss“卡”在了某个位置后难以下降。...} ;W_{o}\in R^{48x1000} 偏移向量:b_{h1}\in R^{1000};b_{h2}\in R^{1000} ;b_{o}\in R^{48} 网络输出:output \in R...权重初始化(weights initialization) W_{h1}、W_{h2}、W_{0}在训练前不能为空,要初始化才能够计算loss从而来降低。...W_{h1}、W_{h2}、W_{0}初始化决定了loss在loss function中从哪个点开始作为起点训练网络。上图用均匀分布初始权重(Uniform distribution)。

    1.5K170

    稀疏分解中的MP与OMP算法

    所不同的是,在稀疏分解中θ是事先不存在的,我们要去求一个θ用Aθ近似表示y,求出的θ并不能说对与错;在压缩感知中,θ是事先存在的,只是现在不知道,我们要通过某种方法如OMP去把θ求出来,求出的θ应该等于原先的...再如,带有孤立不连续点的平滑信号可用小波基稀疏表达,但小波基在表达傅里叶频谱中有窄带高频支撑的信号时却是无效的。   现实世界中的信号经常包含有用单一基所不能表达的特征。...需要注意的是在迭代过程中Φt为所有被选择过的原子组成的矩阵,因此每次都是不同的,所以由它生成的正交投影算子矩阵P每次都是不同的。 (5)直到达到某个指定的停止准则后停止算法。   ...(式2)          其中矩阵A为选择的r个原子组成的矩阵,e(r-1)omp为选择(r-1)个原子时的残差。        ...将选择的r个原子a1,a2,……,ar进行施密特正交化:  ?   则残差eromp还可以写为 ?

    5.8K71

    RD模块在 Faster R-CNN 和 Deformable DETR中的有效性研究,为YOLO 模型带来的性能飞跃 !

    主要目标是调整 Dictionary 的分布,并使 Retriever 核心找到每个输入像素的最佳原子权重。...尽管 PONO 最初设计用于在生成网络中保持结构信息,但在这里它确保特征向量 得到适当的缩放和居中,防止字典矩阵塌陷为零矩阵。 然后,归一化系数被用来从字典中选择原子,以增强或减弱特定特征。...对于从LLM初始化的初始化,由于语言模型不能直接将图像转换为特征嵌入,并且图像描述通常描述整个图像而不是特定区域,因此作者使用MSCOCO 和ImageNet-21k 的类别名称,以及MSCOCO的图像描述作为...然而,在训练之后,字典中的原子数量可能超过所需的数量,其中一些原子使用频率较低或与特定数据集领域无关。...Visualization 在本节中,作者使用可视化方法来展示RD模块对目标检测模型的影响,并可视化Retriever 从 Dictionary 中选择原子。

    12910

    知识图谱推理与实践(1)

    基于知识图谱表示学习的关系推理 将实体和关系都表示为向量 通过向量之间的计算代替图的遍历和搜索来预测三元组的存在,由于向量的表示已经包含了实体原有的语义信息,计算含有⼀定的推理能⼒。...但是RDF表示关系层次受限,因此有了RDFS,在RDF的基础上,新增了Class, subClassOf, type, Property, subPropertyOf, Domain, Range 词汇...因此,我们也叫OWL为本体语言: OWL是知识图谱语言中最规范, 最严谨, 表达能力最强的语言 基于RDF语法,使表示出来的文档具有语义理解的结构基础 促进了统一词汇表的使用,定义了丰富的语义词汇 允许逻辑推理...实例化(materialization),即计算属于某个概念或关系的所有实例的集合。 ? 例子: ?...知识图谱嵌⼊模型: 预测问题 测试三元组( h, r, t ) 尾实体预测( h, r, ? ) 头实体预测( ?, r, t ) ? PRA vs. TransE ? 基于Jena实现演绎推理 ?

    2.5K40

    量子计算(七):量子系统

    在接下系列文章里,彻底抛却数学公式,纯粹去介绍宽泛的概念,目的仅仅想让读者都能了解这个问题——量子究竟是什么。...注意:阅读下面的内容需要一定的数理基础,包括高等数学,线性代数,概率论中的基本概念。态矢 State Vector量子态可用线性代数中的向量来描述,在物理学中,向量常称作矢量。...在量子理论中,描述量子态的向量称为态矢,态矢分为左矢和右矢。右矢(ket):左矢(bra):采用竖线和尖括号的组合描述一个量子态,其中每一个分量都是复数,右上角标T表示转置。...根据可逆矩阵的定义可知,U也是一个可逆矩阵,因此西变换也是一个可逆变换。而在量子计算中,各种形式的酉矩阵被称作量子门。...假设从右边的袋子里取出一个,在不知道手上的态是什么情况下,能说它和左边袋子里的态一样都是吗?答案是不能。右边袋子里的态,实际上是一种经典的概率叠加,和等量的红球白球装在袋子里面一样。

    1.2K72

    AGI之 概率溯因推理的高效DL实现

    在VSA中,从原子到复合结构的所有表现都是相同的固定维度的高维全息向量。...A.定义VSA表示 第一步是定义一个字典,由此可以使用固定宽度的向量来描述原子概念、它们的层次结构以及它们的关系。这些概念是什么可以由认知需求来引导。...每个码本包含与属性值一样多的原子d维向量。因此,它为单个原子矢量提供了一个象征意义。为了描述具有这两个属性的对象,可以通过绑定两个向量来计算乘积向量w,从每个码本中提取一个向量(见图1b)。...这 捆绑操作创建多个对象的等权重叠加,并保持相似性;因此,捆绑了 向量s类似于场景中存在的两个对象向量,而不同于系统中的其他向量,如图1c所示。...可选地,捆绑向量可以被稀疏化为每个块仅具有一个非零元素,然而,这导致信息损失。因此,在这项工作中,捆绑是在没有稀疏化的情况下进行的。 在下文中,我们将说明如何将PMF转换成这种VSA格式。

    21420

    深层学习为何要“Deep”(上)

    情景:x⃗ 是二维向量,维度是碳原子和氧原子的数量 [C;O],数值且定为[1;1],若确定y⃗ 是三维向量,就会形成如下网络的形状 (神经网络的每个节点表示一个维度)。...到此所有数据的维度都已确定: 训练数据:input∈R87;label∈R120 权重矩阵:Wh1∈R1000x87;Wh2∈R1000x1000;Wo∈R120x1000 偏移向量:bh1∈R1000...权重初始化(weights initialization):Wh1、Wh2、W0在训练前不能为空,要初始化才能够计算loss从而来降低。...Wh1、Wh2、W0初始化决定了loss在loss function中从哪个点开始作为起点训练网络。上图用均匀分布初始权重(Uniform distribution)。...在(1)中,当把 ? 输出的一个权重改为-1时, ? 的形状直接倒置了。不过还需要考虑激活函数。(1)中用的是linear。在(2)中,当换成sigmoid时,你会发现没有黄色区域了。

    91910

    AGI之 概率溯因推理超越人类水平

    在VSA中,从原子到复合结构的所有表现都是相同的固定维度的高维全息向量。...A.定义VSA表示 第一步是定义一个字典,由此可以使用固定宽度的向量来描述原子概念、它们的层次结构以及它们的关系。这些概念是什么可以由认知需求来引导。...每个码本包含与属性值一样多的原子d维向量。因此,它为单个原子矢量提供了一个象征意义。为了描述具有这两个属性的对象,可以通过绑定两个向量来计算乘积向量w,从每个码本中提取一个向量(见图1b)。...这 捆绑操作创建多个对象的等权重叠加,并保持相似性;因此,捆绑了 向量s类似于场景中存在的两个对象向量,而不同于系统中的其他向量,如图1c所示。...可选地,捆绑向量可以被稀疏化为每个块仅具有一个非零元素,然而,这导致信息损失。因此,在这项工作中,捆绑是在没有稀疏化的情况下进行的。 在下文中,我们将说明如何将PMF转换成这种VSA格式。

    25320

    你真的了解 volatile 关键字吗?

    使用场景是什么? volatile 关键字实现的原理? volatile 关键字是什么?...注:由于以前的操作系统是 32 位, 64 位数据(long 型,double 型)在 Java 中是 8 个字节表示,一共占用 64 位,因此需要分成两次操作采用完成一个变量的赋值或者读取操作。...在单线程环境中我们可以认为上述步骤都是原子性操作,但是在多线程环境下,Java 只保证了上述基本数据类型的赋值操作是原子性的,其他操作都有可能在运算过程中出现错误。...将 instance 对象指向分配的内存库存空间(执行完这步 instance 就为非 null 了) 但是 JVM 即时编译器中存在指令重排序的优化,也就是说上面的第二步和第三步顺序是不能保证的,最终的执行顺序可能是...如果是后者,线程 1 在执行完 3 之后,2 之前,被线程 2 抢占,这时 instance 已经是非 null(但是并没有进行初始化),所以线程 2 返回 instance 使用就会报空指针异常。

    84710

    ICLR 2022 under review | 从零开始生成三维分子几何结构的自回归流模型

    • 从G中学习一个随机生成模型pθ(·),使该模型可以从高维概率分布pθ(G)中采样一个有效三维分子几何结构G。 • 学习一个目标分子发现模型pθ(·),以最大化(或最小化)预期的量子性质分数 。...因此,易于处理和廉价的计算detJ对于高效的训练是必须的。在大多数流模型中,fθ的一个常见选择是仿射耦合映射,在这种情况下,计算detJ非常容易,因为J是一个上三角矩阵。...矩阵A中的每一行都是一个独热向量,a[j, u]=1表示第j个原子为u类型。在矩阵R的第j行处的行向量表示第j个原子的三维笛卡尔坐标。 作者认为三维分子几何结构的生成是一个连续的决策过程。...因此,作者使用一个对称不变模型来计算s和t。 然而,不能像原子类型ai的生成那样生成三维坐标ri。如果用自回归流模型直接计算ri,坐标的等变性和似然的不变性都不满足。...其次,G-SphereNet中三维位置的生成比G-SchNet中更灵活。在G-SchNet中,新原子必须被放置在一个候选网格点上,而在G-SphereNet中新原子可以放置焦点原子的任何相对位置。

    89120

    Bioinformatics | TransformerCPI模型

    化合物的处理 首先使用RDKit将化合物中每个原子的特征转换为长度为34的向量表示,然后使用GCN(图卷积网络)通过集成相邻原子的特征来学习每个原子的表示。...在TransformerCPI中,蛋白质序列是编码器的输入,而原子序列是解码器的输入,解码器的输出是包含有与原子序列相同长度的相互作用特征向量。...考虑到原子特征向量的顺序对CPI建模没有影响,因此在TansformerCPI模型中删除了原本存在于Transformer模型中的位置嵌入。 ?...因此,“标签反转数据集”的构建遵循两个规则:(1)从实验验证的数据库中收集CPI数据(2)每个配体应同时存在于正负样本中。 首先,作者从GLASS数据库中构建了一个GPCR数据集。...因此,在未来深度学习的发展中,不仅需要新的深度学习方法,还需要新的验证策略和实验设计。

    93271

    知识图谱嵌入(KGE):方法和应用的综述

    虽然在表示结构化数据方面很有效,但是这类三元组的底层符号特性通常使KGs很难操作。 为了解决这个问题,提出了一种新的研究方向——知识图谱嵌入。...在ComplEx中,实体和关系嵌入h,r, t不再存在于实空间中,而是存在于复空间中。定义事实的评分函数为: 其中,t_是t的共轭和Re(·)表示取复数的实部。...通过最小化R_2,我们期望每个实体在误差小的情况下,从其最近的邻域进行线性重构。然后将R_1和R_2合并为正则化项,以约束嵌入任务。在KG嵌入和下游任务中,SSE的性能都优于直接方法。...后来在[ 76 ] 中提出了一种类似的方法,它把实体表示为描述的平均词向量而不仅仅是它们的名称。由于这种方法将文本信息与KG事实分开,因此不能利用它们之间的交互信息。...然后,联合模型将三个损失最小化,即: 联合嵌入利用来自结构化的KGs和非结构化文本的信息。因此,可以通过彼此增强KG嵌入和词嵌入。

    5.4K11

    详解java多线程锁

    ,因此它也有自己的内存模型 在进程概念中,并没有本地内存的概念,只有进程内存,它是一个虚拟的概念....为了实现volatile内存语义,JMM将限制重排序: 当第二个操作是volatile写时,不管第一个操作是什么,都不能重排序。...当第一个操作是volatile读时,不管第二个操作是什么,都不能重排序。这个规则确保 volatile读之后的操作不会被编译器重排序到volatile读之前。...因为方法并没有实现同步,可能会出现多次调用进入==null的情况 基于类初始化的解决方案 JVM在类的初始化阶段(即在Class被加载后,且被线程使用之前),会执行类的初始化。...在 执行类的初始化期间,JVM会去获取一个锁。这个锁可以同步多个线程对同一个类的初始化。

    81421

    关于分子力场中键能项和角能项的思考

    {1}{2}k_b(|\textbf{r}_B-\textbf{r}_A|-b)^2 这里有个细节是,在很多非成键相互作用中,会采用无穷远处的势能为0。...由于我们在动力学模拟的过程中,保存的轨迹信息只有分子的空间坐标和速度的信息,因此我们可以把 \textbf{F}_{bond_i} 写成 \textbf{F}_{bond_i}(\textbf{r}_A...假设有 N 个原子和 P 对键连原子,在一个3维空间下,首先要计算一个矢量 \textbf{r}=\textbf{r}_A-\textbf{r}_B ,这需要 3P 的加法计算量。...从形式上来说,不仅仅是算法变得更加复杂了,而且可读性也并不是很好,但是这里面包含了几个值得思考的点: 对于分子动力学模拟中可能出现的大部分体系而言,成键关系总是稀疏的; 额外的三个初始化操作是在力的计算函数外部完成的...这里提到的矢量化计算的实现方案,虽然从计算的角度来说有大量的冗余,但由于一般情况下,一个分子系统单个原子的成键数量都在4以内(比如C原子的sp3杂化),因此矢量化计算的实现方案也不失为一个很好的参考。

    21310

    摩擦力的调控——应变工程

    作为基础研究人员,研究如何调控摩擦力的大小,使之更好的造福人们的生活,显得尤为重要。...因此,众多学者开始研究二维层状晶体材料(石墨)与超润滑之间的关联,其中的工作有: 2016年,西安交通大学、清华大学李群仰以及宾夕法尼亚大学等首次阐述了石墨烯摩擦演化行为的机理,相关工作在nature上发表...( Li S , Li Q , Carpick R W , et al....疲劳一直广泛存在于工程构件中,有的时候会好奇疲劳的本质是什么? 摩擦力相关: 1、动摩擦和静摩擦在原子级别有什么区别;对于静摩擦来说,应该是有能垒的存在,是什么造成的这个现象?...在实验方面,由于纳米技术的发展,扫描探针显微镜等仪器的出现,人们对于摩擦现象的研究已经深入到原子尺度;在理论方面,由于计算机技术的快速发展,大规模原子模拟成为可能,推动了微观摩擦机理的研究。

    63430

    Free-form Flows比扩散模型提升两个数量级

    在这项工作中,我们提出了一种方法,使正规化流摆脱了传统的架构限制,因此引入了一类灵活的新的最大限度似然模型。对于模型构建者来说,这将重点从满足可逆性要求转移到结合最佳归纳偏差以解决手头问题。...这里的任务是学习大量原子x1, ..., xN ∈ R^n的联合分布。每个生成模型的预测都应该产生每个原子的物理有效位置:x = (x1, ..., xN) ∈ R^(N×n)。...这意味着一个分子的生成模型应该无论方向和转换如何,都产生相同的概率: 这里,旋转Q ∈ R^n×n通过绕原点旋转或反射每个原子xi ∈ R^n来作用于x,而t ∈ R^n对每个原子应用相同的平移。...因此,我们在QM9数据集(Ruddigkeit等人,2012;Ramakrishnan等人,2014)上进行训练,该数据集包含不同原子数量的分子,最大分子包含29个原子。...网络作用于坐标xi ∈ R^3的部分对旋转、反射和平移(欧几里得群E(3))是等变的。网络在这些操作下保持原子属性h不变。 我们在图1中展示了我们模型的样本。

    13410

    Jeff Dean强推:可视化Bert网络,发掘其中的语言、语法树与几何学

    你不能等构地把这棵树嵌入欧氏空间 事实上,图1中的树是一个标准示例,它表明并不是所有度量空间都可以等构地嵌入到R^n其中。...实际上,这很容易写出一个显式的毕达哥拉斯嵌入,使任何树都可以被嵌入到一个单位超立方体的顶点中。 定理1.1 任何具有n节点的树都有一个毕达哥拉斯嵌入到R^(n-1)中。...归纳来说,定义一个嵌入f:T→R^n−1通过 给定两个不同的树节点x和y, 其中m是树的距离d(x,y)我们可以用m个相互垂直的单位基向量从f(x)跳跃到f(y), 因此∥f(x)−f(y)∥^2=m=...让{e1,……,en - 1}为R^n−1维的正交单位基向量。 现在,使wi=d(ti,parent(ti))....使用完全随机的树嵌入进行初始化,另外为每个顶点选择一个特殊的随机向量;然后在每个步骤中,移动每个子节点,使其更接近其父节点的位置加上子节点的特殊向量。结果将是近似的毕达哥拉斯嵌入。

    99430

    Jeff Dean强推:可视化Bert网络,发掘其中的语言、语法树与几何学

    你不能等构地把这棵树嵌入欧氏空间 事实上,图1中的树是一个标准示例,它表明并不是所有度量空间都可以等构地嵌入到R^n其中。...实际上,这很容易写出一个显式的毕达哥拉斯嵌入,使任何树都可以被嵌入到一个单位超立方体的顶点中。 定理1.1 任何具有n节点的树都有一个毕达哥拉斯嵌入到R^(n-1)中。...让{e1,……,en - 1}为R^n−1维的正交单位基向量。 现在,使wi=d(ti,parent(ti)). 归纳来说,定义一个嵌入f,也就是 ?...定理1.2中的嵌入不再存在于单位超立方体上,而是存在于它的压缩版本中:一个边长为{wi^(1/2)}的矩形实体。 我们可以对树结构的边进行索引,每条边都具有与该边上的子节点相同的索引。...使用完全随机的树嵌入进行初始化,另外为每个顶点选择一个特殊的随机向量;然后在每个步骤中,移动每个子节点,使其更接近其父节点的位置加上子节点的特殊向量。结果将是近似的毕达哥拉斯嵌入。

    89620
    领券