首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
您找到你想要的搜索结果了吗?
是的
没有找到

一个有效的图表图像数据提取框架

在本文中,作者通过采用最先进的计算机视觉技术,在数据挖掘系统的数据提取阶段,填补了研究的空白。如图1所示,该阶段包含两个子任务,即绘制元素检测和数据转换。为了建立一个鲁棒的Box detector,作者综合比较了不同的基于深度学习的方法,并找到了一种合适的高精度的边框检测方法。为了建立鲁棒point detector,采用了带有特征融合模块的全卷积网络,与传统方法相比,可以区分近点。该系统可以有效地处理各种图表数据,而不需要做出启发式的假设。在数据转换方面,作者将检测到的元素转换为具有语义值的数据。提出了一种网络来测量图例匹配阶段图例和检测元素之间的特征相似性。此外,作者还提供了一个关于从信息图表中获取原始表格的baseline,并发现了一些关键的因素来提高各个阶段的性能。实验结果证明了该系统的有效性。

04
领券