首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >从PDF文档中提取文本和标签

从PDF文档中提取文本和标签
EN

Stack Overflow用户
提问于 2020-03-07 16:19:42
回答 1查看 553关注 0票数 0

我正在尝试检测和提取的“标签”和“尺寸”的2D技术图纸,这是保存为PDF使用python。我偶然发现了一个名为"pytesseract“的python库,它具有光学字符识别功能。我在我的图像上尝试了演示,但它无法检测大多数标签/尺寸。如果有其他方法,请给我建议。谢谢**。

**附件是我试图检测的2D技术图纸的样本

**我试图实现的是能够获得图像上每个维度( 160,120,10 4x45等)的坐标,并提取。

EN

回答 1

Stack Overflow用户

发布于 2020-05-09 06:16:45

大约16个月前,我们问过自己同样的问题。如果你想自己实现它,我建议使用以下流程:

从sheet中提取画布,分离

  • Cuts

  • 检测每个Cut

上的测量区域

  • 检测测量区域的各个属性,以了解测量的开始和结束位置。在您的特定示例中,这相对简单。

  • 通过OCR

运行检测到的度量标签。将标签与

相关联

或者,您也可以通过我们的API运行它,并以JSON格式获得结果。

这是结果的快速可视化:Drawing Read (GT代表通用公差)

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/60575685

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档