前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >大数据能力提升项目|学生成果展系列之四

大数据能力提升项目|学生成果展系列之四

作者头像
数据派THU
发布2023-04-12 14:40:40
2340
发布2023-04-12 14:40:40
举报
文章被收录于专栏:数据派THU

导读

为了发挥清华大学多学科优势,搭建跨学科交叉融合平台,创新跨学科交叉培养模式,培养具有大数据思维和应用创新的“π”型人才,由清华大学研究生院、清华大学大数据研究中心及相关院系共同设计组织的“清华大学大数据能力提升项目”开始实施并深受校内师生的认可。项目通过整合建设课程模块,形成了大数据思维与技能、跨界学习、实操应用相结合的大数据课程体系和线上线下混合式教学模式,显著提升了学生大数据分析能力和创新应用能力。

回首2022年,清华大学大数据能力提升项目取得了丰硕的成果,同学们将课程中学到的数据思维和技能成功地应用在本专业的学习和科研中,在看到数据科学魅力的同时,也将自己打造成为了交叉复合型的创新型人才。下面让我们通过来自8个院系的10位同学代表一起领略他们的风采吧!

分子间作用对茂金属催化剂的作用机制

亮点

(1)建立分子间作用对催化性能进行调控的理论方法。

(2)建立统计模型,评估不同级别理论方法对外加稠环芳烃化合物配体的催化的能量与几何描述能力。

(3)通过理论分析结果,可视化分子间作用力,并阐明面面构型稠环芳烃二聚体配体的分子间作用力对新型茂钛金属催化剂的调控作用。

本工作着重关注的芳氧基茂钛金属催化剂的一系列单芳烃配体及其面-面构型的二聚体配体的理想构型,其结构示意图如Fig.1所示。其中,a表示单芳烃配体,序号1,2,3,4和5分别对应苯(C6H6)、萘(C10H8)、蒽(C14H10)、芘(C14H10)、蒽(C16H10)和六氟苯(C6F6);b表示单芳烃对应的二聚体配体。

Fig.1MolecularstructuresofauxiliaryligandsR[R=a1)C6H6,a2)C10H8,a3)C14H10,a4)C16H10,a5)C6F6andtheirsandwichdimers,b1)C6H6…C6H6,b2)C10H8…C10H8,b3)C14H10…C14H10,b4)C16H10…C16H10,b5)C6F6…C6F6]tomodifyhalf-titanocenecomplex.

Fig.2展示了扫描精度为0.01Å时二聚体配体能量随构型变化的势能面,涉黑色原点为在ωB97XD/6-311++g(d,p)的几何构型上采用CCSD/cc-pVTZ高精度方法优化得到的能量,方法依赖性整体高于基组依赖性,其中,M06-2X-D3方法对相互作用能有所高估;B3LYP-D3(BJ)方法对有所低估,但基组上升到3Zeta时,B3LYP-D3(BJ)和ωB97XD方法能量计算差距减小。整理来看,M06-2X-D3结合带有弥散函数的基组对能量描述较好。B3LYP-D3(BJ)和ωB97XD对相互作用能有1-2kcal·mol-1的高估。六氟苯(C6F6)的几何和能量描述误差大于其他结构。

Fig.2Potentialenergycurves(kcal·mol-1)forseriesinteractionstructures(seeFig.1)ofsandwichdimerligands,a)C6H6…C6H6,b)C10H8…C10H8,c)C14H10…C14H10,d)C16H10…C16H10,e)C6F6…C6F6.

Fig.3总结了Fig.2所示势能面曲线驻点对应的二聚体几何结构及相互作用能,箱线图展示了不同方法的几何及能量优化结果。可以看出,六氟苯(C6F6)二聚体最优构型面心距离与萘(C10H8)二聚体相近,烷烃二聚体面心距离基本与相互作用能负相关,即二聚体最优构型面心距离越小,相互作用能越大。计算方法的依赖性整体高于基组依赖性,B3LYP-D3(BJ)方法,特别是结合6-31++g(d,p)基组,可能对最优构型的面心距离有所高估;能量描述方面,B3LYP-D3(BJ)方法结合2Zeta基组6-31g(d,p)和6-31++g(d,p)可能对最优构型的作用能有所高估,M06-2X-D3方法结合2Zeta基组则可能对最优构型的作用能有所低估。

Fig.3Interactionenergies(kcal·mol-1)foroptimizedsandwichdimerstructuresbasedonthepotentialenergycurves(seeFig.2).

能量分解是将分子作用力分解成不同物理成分,从而能从能量角度更深入地了解相互作用的本质,其中一种是对称匹配微扰理论

(Symmetry-AdaptedPerturbationTheory,SAPT)。SAPT可以将相互作用能分解为四部分:交换(exchange)、诱导(induction)、静电(electrostatics)和色散(dispersion)。Fig.4的箱线图展示了对5种芳烃二聚体的12种方法优化构型通过PSI4程序采用二阶微扰SAPT2结合jun-cc-pVDZ基组进行能量分解的计算结果。其中,交换能描述分子近距离出现的交换互斥作用,数值为正且越大越不利于分子间的结合,其顺序为:b1<b2<b5<b3<b4;诱导能描述分子电荷相互极化和相互转移的作用,数值为负且绝对值越大越有利于结合,其顺序(绝对值)为:b1<b2<b3<b4<b5;静电能描述片段间经典库仑作用,数值为负且绝对值越大表示吸引作用越大,越有利于结合,其顺序(绝对值)为:b1<b2<b5<b3<b4;色散表示为瞬时偶极之间产生的吸引作用,绝对值越大越有利于结合,其顺序(绝对值)为:b1<b2<b5<b3<b4。总结来看,除C6F6外,交换、诱导、静电和色散相互作用均随环数增多而增加。

Fig.4SAPT2components(kcal·mol-1)ofthedifferencebetweenoptimizedsandwichdimerstructures(seeFig.2).

为考察能量分解各弱相互作用的物理成份与二聚体最优构型、作用能的关系,采用

Lasso(Leastabsoluteshrinkageandselectionoperator)方法进行特征选择后建立多元回归模型。Lasso方法特征选择结果表示,df=3为选择贡献较大的三个特征诱导(induction)、静电(electrostatics)和色散(dispersion),不利于结合的交换(exchange)贡献最小;df=2为选择贡献最大的两个特征静电(electrostatics)和色散(dispersion)。以df=3和df=2与基于ωB97XD/6-311++G(d,p)方法得到的二聚体最优构型和基于耦合簇方法CCSD/cc-pVTZ和双杂化泛函方法PWPB95-D3/def2-QZVPP得到的高精度作用能建立多元回归模型,结果如Fig.5所示,可以看出所选择特征均能较好的拟合几何与能量。df=3时能量预测残差约为±0.2kcal·mol-1,几何预测残差约为±0.02Å;df=2时能量预测残差约为±0.5kcal·mol-1,几何预测残差约为±0.04Å。

Fig.5ResultsofmultifactorlinearregressionanalysisbetweenSAPT2components(seeFig.4)andoptimizedenergiesandstructuresofsandwichdimers(seeFig.2).

为对比不同计算方法和基组对相互作用的描述性能,用R2描述Fig.5拟合优度并展示在Fig.6中,数值越大表示方式的描述性能越好。可以看出,残差较大的两特征(df=2,为静电和色散)的R2普遍小于三特征(df=3,为诱导、静电和色散);基组依赖性普遍高于方法依赖性。在能量描述方面,带有弥散函数的6-31++(d,p)和6-311++(d,p)基组R2普遍大于不带有弥散函数的6-31(d,p)和6-311(d,p)基组,在几何描述方面,基组的弥散函数优势在df=2时更为明显。

Fig.6Performanceofdifferentmethods(seeFig.5)topredictinteractionenergiesandstructuresofsandwichdimersbySAPT2components.

为进一步探索分子间相互作用对茂钛金属催化剂几何参数的影响,本文通过建立片段(O、Ti、Cl、茂和配体)ADCH电荷和几何参数的LASSO回归,进行特征选择,结果如Fig.11所示。Fig.11(a)和(b)分别展示了超参数Lambda优化过程中,各特征系数变化以及误差的变化值,当误差最小时,Cl和茂的系数为0,说明Cl和茂的电荷变化对几何参数影响较小,O、Ti和配体的电荷影响较大。Fig.11(c)和(d)分别展示了选用O、Ti和配体的电荷对O-Ti键长和R-O-Ti键角的拟合情况,进一步证明O、Ti和配体的ADCH电荷(CO,CTiandCLigands)是影响几何参数的重要因素,对键长LO−Ti的预测性能要优于对键角AR−O−Ti的预测。

Fig.11Effectsofmolecularfragmentchargesongeometricparametersofhalf-titanocenecomplex,a)thevariationofcoefficientsandb)errorbarswiththehyperparameterlambdaofLASSOregression;resultsofmultiplelinearregressiontopredictc)LO−Tiandd)AR−O−Tibasedonfeatureselection.

编辑:文婧

校对:程安乐

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2023-04-11,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 数据派THU 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
大数据
全栈大数据产品,面向海量数据场景,帮助您 “智理无数,心中有数”!
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档