首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
您找到你想要的搜索结果了吗?
是的
没有找到

Acta Pharm. Sin. B | MF-SuP-pKa: 一种基于多精度学习和子图池化的通用pKa预测模型

本文介绍一篇来自浙江大学侯廷军教授和谢昌谕教授课题组、中南大学曹东升教授课题组、碳硅智慧和腾讯量子实验室联合发表在Acta Pharmaceutica Sinica B的论文《MF-SuP-pKa: Multi-fidelity modeling with subgraph pooling mechanism for pKa prediction》。该论文提出了一种将化学领域知识和图神经网络算法相结合的通用pKa预测模型MF-SuP-pKa。作者采用子图池化(subgraph pooling, SuP)算法提高模型对分子局部和全局信息的表征能力;利用解离反应的可逆性进行数据增强(data augmentation, DA),将模型适用范围拓展至带电分子;此外,采用多精度学习(Multi-fidelity learning,MFL)的训练策略充分利用高-低精度数据集,有效提高了模型的泛化能力。实验结果表明,MF-SuP-pKa在微观pKa(micro-pKa)和宏观pKa(macro-pKa)的预测中均取得了最优性能,与现有的开源模型相比适用范围更广,使得多步电离预测成为可能。

02

基于OpenCV修复表格缺失的轮廓--如何识别和修复表格识别中的虚线

通过扫描或照片对文档进行数字化处理时,错误的设置或不良的条件可能会影响图像质量。在识别的情况下,这可能导致表结构损坏。某些图标的处理结果可能只是有轻微的瑕疵,甚至只是一些小孔,但是无法将其识别为连贯的系统。有时在创建在单元格时,表的某些侧面可能也没有线的存在。表和单元格类型多种多样,因此通常所提出的代码可能并不适合所有情况。尽管如此,如果我们能对提取的表格进行少量修改,大部分程序仍然可以使用。大多数表格识别算法是基于表格的结构。由于没有完整的边线会使一些单元格无法被识别,导致不良的识别率,因此我们需要想办法修复这些丢失的线段。

02

基于OpenCV修复表格缺失的轮廓--如何识别和修复表格识别中的虚线

通过扫描或照片对文档进行数字化处理时,错误的设置或不良的条件可能会影响图像质量。在识别的情况下,这可能导致表结构损坏。某些图标的处理结果可能只是有轻微的瑕疵,甚至只是一些小孔,但是无法将其识别为连贯的系统。有时在创建在单元格时,表的某些侧面可能也没有线的存在。表和单元格类型多种多样,因此通常所提出的代码可能并不适合所有情况。尽管如此,如果我们能对提取的表格进行少量修改,大部分程序仍然可以使用。大多数表格识别算法是基于表格的结构。由于没有完整的边线会使一些单元格无法被识别,导致不良的识别率,因此我们需要想办法修复这些丢失的线段。

01
领券