前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >线上分享 | 自动拼接甲骨碎片,计算机视觉准确率高达84%

线上分享 | 自动拼接甲骨碎片,计算机视觉准确率高达84%

作者头像
机器之心
发布2023-03-29 17:12:55
3170
发布2023-03-29 17:12:55
举报
文章被收录于专栏:机器之心

1912年,德国的魏格纳通过观察地图上各大洲的海岸线,提出了地球上所有大陆曾经是统一的「泛大陆」的大陆漂移说;1917年,中国的王国维发现两片残缺的甲骨可以缀合,拼出较为完整的卜辞,开创了甲骨缀合的先河。

研究人员告诉我们:「甲骨学者普遍认为,缀合出一块较为完整的、可用于甲骨文研究的甲骨,其价值不亚于发现一块新的甲骨。」要利用甲骨文来研究古代的历史,必须首先对甲骨进行缀合,尽可能地恢复其本来面貌。

最近,西南大学计算机与信息科学学院陈善雄副教授和首都师范大学甲骨文研究中心莫伯峰副教授,通过使用一种新的依据边缘轮廓匹配的计算机视觉算法,实现了甲骨碎片的自动拼缀,准确率达到84%以上,为将来在全球甲骨拓片的数据集上实现自动化甲骨缀合打下了坚实的基础。

论文题目为《The Research on Rejoining of the Oracle Bone Rubbings Based on Curve Matching》,已被期刊 ACM Transactions on Asian and Low-Resource Language Information Processing 接收。

甲骨文作为我国最早的成熟文字、世界四大古文字之一,因刻写在龟甲和兽骨上而得名,记载了三千年前商朝的珍贵史料,更是入选联合国教科文组织「世界记忆名录」。目前,已出土的甲骨碎片多达16万余件。

可惜的是,这些甲骨碎片被埋在地下多年,经历了地下活动的冲击和挖掘造成的磨损,多数甲骨残缺严重;又由于随着人类历史的迁徙遍布于世界各个角落,很难有完整的信息。因此,将分散的甲骨碎片组合成一个完整的卜辞,成为了甲骨文研究重要的基础课题。

过去,甲骨缀合是由数名甲骨文学者通过视觉评估和经验评估进行的。虽然为我们提供了很多很好的范本,但是效率缓慢,更何况有大量甲骨碎片散落世界各地。近期,随着人工智能的引入,这一挑战有了些许进展,但仍然是依照传统的字体、分类、同文、残字等线索进行缀合。甲骨碎片的轮廓曲线这一更为直观的线索,因为难以被人类视觉轻易捕捉而被忽视。

基于不同线索的甲骨缀合示例。(a)字体;(b)残字;(c)同文;(d)轮廓曲线。(来源:论文)

该团队基于缘轮廓匹配的思路,提出了皮尔逊相关性分析算法 (CAP) 和拟合度分析算法 (CFDA)相结合的计算机视觉方案 ,通过采用 CFDA 算法进行拟合度评分,再用 CAP 对初步筛选的候选项进行皮尔逊系数计算的方式,在一定程度上提高了曲线匹配准确率,同时增强了曲线匹配在小样本上的准确度。

自动甲骨拓片缀合模型。(来源:论文)

通过与传统的单独 CAP 、切比雪夫距离等多个算法进行实验对比,结果显示 CFDA & CAP 的准确率较为稳定,对于不同的候选图像库的容量大小,其平均性能可达到84%;而在小样本任务上, CFDA & CAP  的准确率至少比其他方法高出了 25% 。

不同曲线匹配算法的准确度。(来源:论文)

相关的预处理工作

即使在资源匮乏的情况下,该团队所提出的模型也能保证甲骨碎片自动缀合的准确性。这在一定程度上离不开高质量的数据,为此,研究人员在数据的标注和处理上下了很大的功夫,创新性提出了高效的曲线特征提取流程。

曲线特征用于建立两个碎片之间的关系,合理选择特征空间可以提高配准算法的适应性,缩小搜索空间,减少噪声等不确定因素对匹配算法的影响。该团队提出的曲线特征提取流程包括三个阶段:曲线标注、位置矫正和特征提取。

为了与目标曲线进行匹配,在曲线标注阶段,存在标注曲线的起点和终点颠倒的情况,因此,部分曲线需要在位置矫正阶段经过 180° 旋转,以得到正确的位置;在特征提取阶段,使用直角坐标系为甲骨文拓片的轮廓曲线进行建模,得到曲线的水平距离(𝐾𝑖)和垂直距离(𝐷𝑖)。

提取局部特征。(来源:论文)

进行局部特征提取时,研究人员只提取每条曲线的 𝐾𝑖和 𝐷𝑖,而忽略曲线上两个相邻点之间的关系。为了获得全局特征,通过进一步提取全局离散点收集坐标点,再用高斯平滑对其进行去噪,使得曲线在同一坐标系中可以进行精确匹配和比较。尽管标记的轮廓曲线在每个垂直方向上可能有一个以上的像素点,但没有必要覆盖尽可能多的坐标点,因此算法按顺时针搜索下一个提取点。

基于目标曲线的坐标点搜索策略。(来源:论文)

破解甲骨研究难题

甲骨文是汉字的源头和中华优秀传统文化的根脉,值得倍加珍视、更好传承发展。国务院副总理孙春兰就曾指出,要综合运用人工智能识别等技术手段,推动研究实现新突破。

作为提供新材料使研究永葆生机的一种重要方式,甲骨缀合是甲骨研究永恒的主题。随着利用人工智能进行甲骨缀合的研究出现,甲骨专家可以将更多的精力放在甲骨文义本身,早日为我们破解出商朝历史。

图示:甲骨缀合。(来源:论文)

从大量碎片中找到有着相似边缘的两块甲骨拼接起来,有人曾说甲骨缀合就是拼图,但实际上,甲骨缀合的核心是要对甲骨材料非常熟悉。陈善雄副教授和莫伯峰副教授领导的研究小组是率先开展利用人工智能技术进行甲骨研究的团队,在此项研究之前,就已经提出过一种用多区域划分的卷积神经网络对甲骨拓片进行材质分类的人工智能方法。

拼图都是既定的,而甲骨缀合却是有变数的。所以,甲骨缀合貌似是拼图,却需要大量的积累和准确的识别。利用人工智能进行甲骨文文字研究也并非一蹴而就。目前,新算法还只是在现有的较少量的甲骨拓片数据集上,进行一对一的缀合测试。未来,该团队计划将两片甲骨碎片的缀合拓展成多片的缀合,并将利用深度学习技术进一步提高效率。

线上分享

为了让大家细致了解本项研究,机器之心邀请到了西南大学计算机与信息科学院副教授陈善雄带来线上分享。

分享主题:人工智能在古籍文档整理中的研究与应用

嘉宾简介:陈善雄,西南大学计算机与信息科学院副教授、硕士生导师、计算应用专业博士、澳大利亚南澳大学访问学者,CCF和IEEE会员,知识工程与分布智能专业委员会青年委员,CSIG专业委员会委员,重庆市认知科学学会理事,中国通信学会移动媒体与文化计算委员会委员。主持和参与国家自然科学基金、重庆市自然科学基金重点项目、863项目等三十余项多项课题。

在《计算机学报》,《通信学报》,《自动化学报》《ACM T ASIAN LOW-RESO》,《in IEEE Systems Journal》,等国内外刊物上发表SCI/EI检索论文30余篇。从2014年起担任国家自然科学基金委通讯评议人。担任《计算机学报》、《Journal of Network and Computer Applications》、《通信学报》等十余期刊的审稿人

主要从事数据挖掘 、模式识别方面的研究,主要采用深度学习相关理论和技术对自然场景的文本,图像进行研究,把人工智能和文化计算结合,推动语言文字的信息化。

分享摘要:古代文献是记录人类历史文明的重要载体,具有无可替代的研究价值。这些文献时间跨度大,保存形式多样,载体类型丰富。长期以来,古文献学家都是依靠多样的领域知识从古籍中提取重要信息。随着AI技术发展,对古籍文献进行数字化处理,利用AI算法自动提取古籍中的文本和图像数据,分析并解读蕴藏在浩瀚典籍中的重要史料和关键信息,提升领域专家的考释分析能力,把专家从浩如烟海的古籍文献整理中解放出来,这正在成为一种发展方向。

直播时间:北京时间6月30日19:00-20:00

直播间:https://jmq.h5.xeknow.com/s/3pgI3J(点击阅读原文直达)

加入机动组,一起看直播

「机动组」是机器之心人工智能技术社群,将持续提供技术公开课、论文分享、热门主题解读等线上线下活动,同时「机动组」也将不定期组织人才服务、产业技术对接等活动,欢迎所有 AI 领域技术从业者加入。

识别二维码,加入本次直播交流群。如群已超出人数上限,请添加小助手syncedai5或syncedai6,备注「古籍」即可加入。

点击阅读原文,收藏直播间。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2021-06-28,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 机器之心 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 直播时间:北京时间6月30日19:00-20:00
相关产品与服务
云直播
云直播(Cloud Streaming Services,CSS)为您提供极速、稳定、专业的云端直播处理服务,根据业务的不同直播场景需求,云直播提供了标准直播、快直播、云导播台三种服务,分别针对大规模实时观看、超低延时直播、便捷云端导播的场景,配合腾讯云视立方·直播 SDK,为您提供一站式的音视频直播解决方案。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档