文章/答案/技术大牛

发布

社区首页 >问答首页 >复杂文档的OCR扫描

问复杂文档的OCR扫描
EN

Stack Overflow用户

提问于 2012-04-08 12:37:49

回答 1查看 1.4K关注 0票数 1

我需要创建一个工具，将使用高质量的相机，以扫描特定的文本块从文件和OCR他们。每个文档都匹配相同的模板，其中包含几个填充了数据的表。我需要从每个扫描文档中提取一个特定单元的数据。

我需要考虑旋转和轻微的图像转换。整个工作流应该如下所示：

文档被“显示”给摄像机。软件制作文件的图片。
软件占了一些小的旋转和其他转换(小剪切，缩放，旋转可能发生，因为文档是掌握在手中)。
软件识别正确的模板文档正在显示，并从特定的单元格中提取图像。
然后图像是OCR。

基本上，我不需要一个最终的解决方案，而是一些方向，从哪里开始寻找。我知道如何对纯文本执行OCRing，我不知道的是如何实现步骤2和步骤3。

提前谢谢。

algorithm

image-processing

language-agnostic

ocr

回答 1

Stack Overflow用户

回答已采纳

发布于 2012-04-09 11:21:40

基本上，普通文本的OCR，悲观地说，当涉及到非常好的扫描图像时，是一个很好解决的任务。您所描述的是更进一步-图像预处理和场级识别与数据捕获。据我所知，开源引擎(甚至是被认为是其中最好的tesseract )也没有提供这样的功能。

同时，专有的OCR引擎多年来一直在解决您描述的任务(花费了大量的人力资源)，并且进展非常顺利。因此，如果您正在规划一个商业软件，我建议您查看一下http://ocrsdk.com，它是一个带有web的云OCR。它允许您上传图像并将OCRed数据发回给您。它已经内置了所有可能的图像预处理算法，所以您不必担心步骤2。至于步骤3，您可能需要参考它的文档的本节。我是开发这项服务前端的团队的一员，所以我可以更多地了解它。希望能帮上忙！

票数 0

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/10062840

复制

相似问题

问复杂文档的OCR扫描
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问复杂文档的OCR扫描EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问复杂文档的OCR扫描
EN