首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
您找到你想要的搜索结果了吗?
是的
没有找到

J. Phys. Chem. C | 基于自然语言处理的材料化学文本数据库

今天为大家介绍的是来自Kamal Choudhary团队的一篇论文。在这项工作中,作者介绍了ChemNLP库,它可用于以下方面:(1)整理材料和化学文献的开放访问数据集,开发和比较传统机器学习、transformer和图神经网络模型,用于(2)对文本进行分类和聚类,(3)进行大规模文本挖掘的命名实体识别,(4)生成摘要以从摘要中生成文章标题,(5)通过标题生成文本以建议摘要,(6)与密度泛函理论数据集集成,以识别潜在的候选材料,如超导体,以及(7)开发用于文本和参考查询的网络界面。作者主要使用公开可用的arXiv和PubChem数据集,但这些工具也可以用于其他数据集。此外,随着新模型的开发,它们可以轻松集成到该库中。

03

Nat. Comput. Sci. | 通过图神经网络快速评估有机分子在金属上的吸附能量

今天为大家介绍的是一篇使用图神经网路快速评估有机分子在金属上的吸附能量的论文。在异质催化中进行建模需要对吸附在表面上的分子的能量进行广泛评估。这通常通过密度泛函理论来实现,但对于大型有机分子来说,这需要巨大的计算时间,从而损害了该方法的可行性。在这里,作者设计了GAME-Net,一种用于快速评估吸附能的图神经网络。GAME-Net在一个平衡的化学多样性数据集上进行训练,其中包含了具有不同官能团的C分子,包括N、O、S和C芳香环。该模型在测试集上的平均绝对误差为0.18电子伏,并且比密度泛函理论快了6个数量级。应用于生物质和塑料中,预测的吸附能误差为0.016电子伏每个原子。该框架为催化材料的快速筛选提供了可用工具,特别适用于传统方法无法模拟的系统。

02
领券