ocr转换工具 - 腾讯云开发者社区

OCR软件是否能够可靠地将像下面这样的图像转换成值列表？更新：我们有一个客户端应用程序，用户可以在其中打开报表。此报告包含一个值表。现在，我们希望使用OCR工具将选定的表转换为值。当用户选择矩形区域时，我可以请求额外的信息来帮助OCR过程，并要求确认值是否正确。它最初将是一个实验项目，因此最有可能使用OpenSource OCR工具--或者至少一个不需要花费任何费用用于实验目的的工具。

浏览 12提问于2011-05-30得票数 26

回答已采纳

1回答

无法将PDF转换为文本格式

、、、

我得到了这个错误，而解析的PDF文件使用pypdf2，我是随同错误的PDF附件。 I have attached the PDF to be parsed please click to view 有人能帮上忙吗？ import PyPDF2 read_pdf = PyPDF2.PdfFileReader(pdfName) page_content = page.extractText()

浏览 32提问于2019-04-14得票数 0

1回答

需要有关Android应用程序的帮助

、

我正在为android系统手机开发一个使用光学字符识别(OCR)的应用程序。我们可以转换Matlab程序是Android应用吗？如果有任何工具将matlab代码转换为Android应用程序的话。工具名是什么？？

浏览 4提问于2012-09-21得票数 0

2回答

SDK环境下的Android名片扫描库

、

有没有名片扫描器的库?我是android新手。帮帮我。提前谢谢。

浏览 5提问于2014-03-07得票数 7

2回答

OCR从扫描卡转换阿拉伯文和英文文本

、、、、

哪一个是好的，但经济的(或免费的) OCR转换阿拉伯文和英文文本扫描卡图像？平台可以在.NET框架内使用SDK。

浏览 0提问于2015-02-05得票数 3

回答已采纳

3回答

运行ImageMagick将低质量pdf转换为图像(用于OCR)的最佳参数是什么？

、、、、

我想使用OCR --更准确地说，是用从他们那里获取文本。为此，我使用了first --一个将pdf转换为图像的命令行工具--将这些pdf转换为jpg或png。我想了解处理低质量pdf的最佳参数是什么，以便为OCR提供尽可能好的质量图像。我已经找到了，但是我不知道从哪里开始。

浏览 0提问于2010-09-01得票数 9

回答已采纳

1回答

使用Python PyPDF2从扫描的pdf (图像)中提取文本

、、、

我一直在尝试从扫描的PDF中提取文本(具有不可选文本的图像)。我想要的信息，包含日期，发票编号从pdf链接()。import PyPDF2pdf_reader = PyPDF2.PdfFileReader(r'document.pdf', 'rb')if '/XObject' in page['/Resources']: xobject

浏览 2提问于2020-05-27得票数 1

回答已采纳

3回答

从屏幕抓取中解析文本

、、、、

我不确定最好的解释方式，但我会试一试。我正在尝试找到一种方法，用C#或java从屏幕抓取中解析文本/数字--无论哪种方法提供最简单的方法，但最好是Java。任何反馈都是值得感谢的。谢谢

浏览 0提问于2010-06-07得票数 3

回答已采纳

2回答

如何在pdf文件中复制图像中的文本？

、、

我可以使用evince文档查看器使用文本查看pdf图像，但是我不能选择图像中的文本来复制和粘贴。如何在pdf文件中从图像中复制文本？

浏览 0提问于2014-09-19得票数 0

4回答

哪些工具可以在Mac上将扫描过的纸张文件转换成可搜索的文本pdf？

、、、、

我需要将扫描文档转换为mac上可搜索的文本PDF。它不需要免费，只需要比Acrobat更低的成本。

浏览 0提问于2015-03-02得票数 2

回答已采纳

1回答

Python库或工具，可以在可搜索/可选择的PDF中获取包围框，而无需使用tesseract或任何其他与OCR相关的解决方案

、、、、

我找不到一个python脚本或库，或者一个工具，可以在一个可搜索/可选择的PDF文件中给我在文本周围的包围框。我发现的所有工具首先将PDF转换成图像，或者使用GhostScript或其他工具，然后使用OCR解决方案(如Tesseract )提取包围框。我试着寻找解决方案，并找到了一些，但他们使用的OCR服务，如Tesseract在某一时刻。以下是我找到的一些解决方案。

浏览 9提问于2022-11-10得票数 0

1回答

有没有可能确定图像文件是否通过OCR转换为word文件

有没有办法确定一个图像文件是不是通过OCR或not...when转换成word文件的?转换后的文件中的所有错误都是通过比较原始图像文件来纠正的，并且纠正了所有visible...is格式的错误。

浏览 9提问于2016-08-09得票数 0

1回答

从pyOCR没有可用的工具

、

sudo apt-get install tesseract-ocrsudo apt-get install tesseract-ocr-ell

浏览 2提问于2015-08-08得票数 12

2回答

有没有可能把pdf转换成文本？

、

在Android中可以将pdf文件转换为文本(字符串或字符)吗？

浏览 0提问于2011-08-26得票数 3

回答已采纳

1回答

示例标注工具OCR文本检测问题

、、

我有一个关于Azure Form Recognizer的手写文本OCR的问题。在Azure的示例标签工具中添加标签之前，在手写PDF文件上运行OCR时，OCR通常会错误地检测文本。对于其他表单分析和提取技术，通常提供一个选项来输入应该被检测到的文本，以本质上“校正”OCR。对于在示例标签工具(Docker图像)中训练Azure Form Recognizer，我看不到一种覆盖OCR文本并输入正确文本的方法。有没有一种方法可以自己输入OCR检测不到或

浏览 37提问于2020-07-15得票数 1

回答已采纳

2回答

如何转换特定的no。使用imagemagick将.pdf文件中的页转换为.png图像

、、、、

我正在使用Imagemagick将我的.pdf文件转换为.png映像$convert sample.pdf image.png转换一个特定的号码。

浏览 3提问于2010-09-30得票数 3

回答已采纳

1回答

pdf的x，y窗口内的OCR

、

我需要找到一个开放源码或基于linux的实用程序，它允许我在设置文件中设置x，y坐标。然后我想按顺序打开pdf，在文件中查找名字、姓氏和账号，并用由姓氏和文件号组成的文件名保存文件。

浏览 0提问于2011-01-08得票数 3

3回答

为什么pdf2image给我一个空白的图像文件？

、、、、

我试图使用Tesseract OCR在多个大pdf文件上执行OCR (~400-600页)。我不一定要从所有页面中提取文本，但我只想要几页(页码已知)。PDF文件似乎已经在上面执行了某种OCR，但这不是一个好工作。import cv2 pytesseract.pytesseract.tesseract_cmd = r"C:/Program Files/Tesseract-OCR我也尝试了OCR，手动将页面转换成图像(剪

浏览 10提问于2021-06-06得票数 2

1回答