开发者社区

文档建议反馈控制台

文章/答案/技术大牛

发布

社区首页 >问答首页 >从PDF文档中提取文本和标签

问从PDF文档中提取文本和标签
EN

Stack Overflow用户

提问于 2020-03-07 16:19:42

回答 1查看 553关注 0票数 0

我正在尝试检测和提取的“标签”和“尺寸”的2D技术图纸，这是保存为PDF使用python。我偶然发现了一个名为"pytesseract“的python库，它具有光学字符识别功能。我在我的图像上尝试了演示，但它无法检测大多数标签/尺寸。如果有其他方法，请给我建议。谢谢**。

**附件是我试图检测的2D技术图纸的样本

**我试图实现的是能够获得图像上每个维度( 160,120,10 4x45等)的坐标，并提取。

text-recognition

image-processing

EN

回答 1

Stack Overflow用户

发布于 2020-05-09 06:16:45

大约16个月前，我们问过自己同样的问题。如果你想自己实现它，我建议使用以下流程：

从sheet中提取画布，分离

Cuts

检测每个Cut

上的测量区域

检测测量区域的各个属性，以了解测量的开始和结束位置。在您的特定示例中，这相对简单。

通过OCR

运行检测到的度量标签。将标签与

相关联

或者，您也可以通过我们的API运行它，并以JSON格式获得结果。

这是结果的快速可视化：Drawing Read (GT代表通用公差)

票数 0

EN

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/60575685

复制

相似问题