前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >原创 | 机器学习在分子动力学领域顶会论文初探

原创 | 机器学习在分子动力学领域顶会论文初探

作者头像
数据派THU
发布2023-03-29 10:58:35
6000
发布2023-03-29 10:58:35
举报
文章被收录于专栏:数据派THU
代码语言:javascript
复制
作者:王可汗
校对:陈之炎本文约2000字,建议阅读5分钟本文解读了机器学习在分子动力学领域的最新研究,带你速读4篇相关领域的最新顶会论文。

分子动力学是现代计算凝聚态物理的重要力量,它经常用于模拟材料。当前,以机器学习为代表的人工智能技术在分子动力学的科学计算领域潜力巨大,展示出旺盛的生命力和光明前景。本文解读了机器学习在分子动力学领域的最新研究,带你速读4篇相关领域的最新顶会论文。

1.论文题目原文:

FORCES ARE NOT ENOUGH: BENCHMARK AND CRITICAL EVALUATION FOR MACHINE LEARNING FORCE FIELDS WITH MOLECULAR SIMULATIONS(IC3LR 202)

论文题目译文:分子模拟的机器学习力场基准和关键评估(ICLR 2023)

论文作者:麻省理工学院XiangFu∗、WujieWang、RafaelGomez-Bombarelli等

原文链接:https://arxiv.org/abs/2210.07237

图1:NequIP和Gemnet力场并不能再现对应体系的轨迹

内容简介:分子动力学模拟广泛应用于自然科学的各个领域。机器学习力场开始取代从头算第一性原理方法直接从分子的原子结构预测力,由于其兼顾计算速度与精度的优点,有望再现真实的分子动力学轨迹。然而,目前机器学习力场的评价标准都局限于力和能量的预测精度,这对于上述目标来说是远远不够的。作者选取了包括水,有机小分子,多肽和晶体材料在内的一系列体系,通过设计一系列描述轨迹稳定性的评价标准,说明了目前精度较高的一些机器学习力场并不能很好地再现轨迹。作者提出,稳定性应该成为机器学习力场评价的一个新标准。

2. 论文题目原文:Injecting Domain Knowledge from Empirical Interatomic Potentials to Neural Networks for Predicting Material Properties (NeurIPS 2022)

论文题目译文:将原子间势的经验域知识注入神经网络,用于预测材料特性(NeurIPS 2022)

论文作者:明尼苏达大学Zeren Shui、Daniel S. Karls、Ilia A. Nikiforov、Ellad B. Tadmor

原文链接:https://arxiv.org/abs/2210.08047

图2:本文的算法流程图

内容简介:密度泛函理论是一种基于量子力学的计算化学方法,它的计算结果较为准确,然而计算成本高昂。所以,以往很多研究人员致力于定义基于物理的具有解析表达式的经验力场,但是其精度有限。近年来,神经网络势成为了兼顾二者优势的桥梁,然而其训练过程往往需要大量DFT标记的样本。对此,本文的作者提出两个策略,通过利用经验力场里的物理信息,实现弱监督学习的神经网络势。第一个策略是,通过训练一个分类器去挑选未标记样本可能的最好经验力场,将该力场计算得到的能量值作为该未标记样本的标签值,实现数据增强。第二个策略则是基于迁移学习,先在一个大量通过经验力场获得的数据集中训练,再利用DFT标记的样本进行微调。实验显示,第一个策略可将性能提升5%-51%,第二个策略则可提升多达55%。

3.论文题目原文:Supervised Pretraining for Molecular Force Fields and Properties Prediction (NeurIPS 2022)

论文题目译文:带监督的分子场力预训练和属性预测(NeurIPS 2022)

论文作者:字节跳动Xiang Gao、 Weihao Gao、 Wenzhi Xiao、 Zhirui Wang、 Chong Wang、, Liang Xiang等

原文链接:https://arxiv.org/abs/2211.14429

图3:本文的工作流框架

内容简介:字节跳动的研究人员在一个具有8600万分子的数据集上对神经网络势进行了预训练。实验表明,相比从头训练,预训练网络微调的模型在7个分子预测性质任务和5个力场任务中性能都有大幅度提升。作者还提出一种线性探测的方式,通过逐层分析网络在预训练过程中学到的分子表示,证实了该策略可以有效预测包括原子类型,原子间距离,分子骨架类型在内的诸多分子性质。

4.论文题目原文:MACE: Higher Order Equivariant Message Passing Neural Networks for Fast and Accurate Force Fields (NeurIPS 2022)

论文题目译文:MACE:高阶等变消息传递神经网络的快速和准确场力(NeurIPS 2022)

论文作者:剑桥大学Ilyes Batatia、 Gregor N. C. Simm等

原文链接:https://openreview.net/forum?id=YPpSngE-ZU

内容简介:消息传递网络(MPNN)是一种图神经网络,它们将标记的图映射到向量空间,在分子力场领域,原子的标签称为态。这些态往往是半局域的(存在截止距离)。MPNN包括三个阶段,分别是消息传递阶段(聚合阶段)、更新阶段和读取阶段。现存的大多数MPNN力场都是基于两个原子相互作用即二体信息的,这意味着他们只依赖于两个原子的态,即二体相互作用。这明显于实际情况不符,然而多体作用往往会带来计算成本的提升。本文作者提出了一种策略,可以在仅用两次消息传递实现四体相互作用,同时兼顾了准确性和高效性。这一点在rMD17,3BPA以及AcAc等benchmark数据集任务中得到证实。

结论:以上四篇论文来自欧美顶尖学院(如美国的麻省理工和英国的剑桥大学)或公司(字节跳动),代表了人工智能在分子动力学领域的最新进展和研究方向,供在这一领域有深耕意向的读者参考。

编辑:王菁

校对:王欣

数据派研究部介绍

数据派研究部成立于2017年初,以兴趣为核心划分多个组别,各组既遵循研究部整体的知识分享实践项目规划,又各具特色:

算法模型组:积极组队参加kaggle等比赛,原创手把手教系列文章;

调研分析组:通过专访等方式调研大数据的应用,探索数据产品之美;

系统平台组:追踪大数据&人工智能系统平台技术前沿,对话专家;

自然语言处理组:重于实践,积极参加比赛及策划各类文本分析项目;

制造业大数据组:秉工业强国之梦,产学研政结合,挖掘数据价值;

数据可视化组:将信息与艺术融合,探索数据之美,学用可视化讲故事;

网络爬虫组:爬取网络信息,配合其他各组开发创意项目。

点击文末“阅读原文”,报名数据派研究部志愿者,总有一组适合你~

转载须知

如需转载,请在开篇显著位置注明作者和出处(转自:数据派THUID:DatapiTHU),并在文章结尾放置数据派醒目二维码。有原创标识文章,请发送【文章名称-待授权公众号名称及ID】至联系邮箱,申请白名单授权并按要求编辑。

未经许可的转载以及改编者,我们将依法追究其法律责任。

点击“阅读原文”加入组织~

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2023-03-08,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 数据派THU 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
NLP 服务
NLP 服务(Natural Language Process,NLP)深度整合了腾讯内部的 NLP 技术,提供多项智能文本处理和文本生成能力,包括词法分析、相似词召回、词相似度、句子相似度、文本润色、句子纠错、文本补全、句子生成等。满足各行业的文本智能需求。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档