ocr软件可以实现的功能是_ocr软件的功能_如何实现ocr的功能 - 腾讯云开发者社区

、、

我是android领域的新手。我想制造与android中的ocr相关的名片扫描仪。为此，我使用这个网站参考。现在基于这个网站，我完成了所有的任务。但后来我无法决定该做什么。.I对于OCR代码中的get输出没有一个完美的方向。我有三个相关的选择： (JAVA代码) (ocr的字快照代码) (梅佐凡提) 请给出一个正确的方向。。谢谢。。

浏览 6提问于2011-09-02得票数 3

1回答

有人知道一个工作的OCR (PHP)吗？

、

可能重复：我已经找了将近3天的OCR类(必须是PHP)。有人知道工作的OCR吗？如果您有OCR样品，请指导我。

浏览 1提问于2011-01-26得票数 3

回答已采纳

2回答

如何从C#调用Acrobat功能光学字符识别？

、、、、

我想写一个可以利用Adobe Acrobat中的OCR功能的C#应用程序。我怎么才能叫它呢？有公共API吗？

浏览 0提问于2009-07-03得票数 3

1回答

我想从OCR数据中提取表信息。

、、、

我想从OCR数据中提取表格信息，我有原始文本和它的文本。我试过pytesseract，但找不到实际的实现。下面是一张图片：我试过这个：这种方法对我一点用也没有。我希望从OCR数据中获得此表的表格结构，以供进一步处理。

浏览 3提问于2019-01-20得票数 0

5回答

我们需要高容量扫描和ocr解决方案我们正在谈论的是每天数字化大约4000个文档，并用ocr (带有隐藏文本)将它们保存为pdf文件…… 该解决方案应该让操作员扫描文档，并自动将文件保存到特定的网络资源，以便由应用程序将其上传到数据库... 我们正在评估来自kofax 的企业解决方案。你还知道其他什么产品？有类似需求的经验吗？有没有开源的(或者至少是可访问的)解决方案？ com、activex api支持？

浏览 1提问于2009-05-21得票数 1

2回答

扫描文件作为可搜索的PDF -工作流程是什么？

我最近买了一台爱普生扫描仪，这样我就可以开始数字化多年来积累的大量文件。我已经学会了如何将文档扫描到PDF文档中，但是，我想确保我的PDF文档有可搜索的文本--我认为技术术语是OCR，但我完全搞不懂。我可以用我的扫描仪把文件扫描到PDF中。但是，如果我正确理解，我无法使他们OCR搜索，除非我使Acrobat和/或ABBYY精细阅读器的工作流程的一部分。(顺便说一下，我用的是一台运行小牛的Mac电脑。) 我想我需要问的第一件事是:我需要什么软件来创建一个OCR可搜索的PDF？就像我说的，我已经安装了爱普生扫描仪软件，但看起来我也需要Acrobat和/或ABBYY精细阅读器。我想我应该问的第二

浏览 0提问于2014-05-12得票数 0

回答已采纳

3回答

文档OCR /可读性的图像处理/增强算法？

我正在寻找算法，论文，或软件，以增强传真，从手机摄像头的图像，以及其他类似来源的可读性和OCR。我主要对简单的增强功能感兴趣(例如：你可以用ImageMagick做的事情)，但我也对更复杂的技术感兴趣。我已经和供应商谈过了，所以对于这个问题，我主要是寻找算法或开源软件。进一步澄清:我不是在寻找OCR软件或算法；我是在寻找算法来清理图像，使其看起来更具人眼可读性，并可能用于OCR。

浏览 3提问于2009-04-03得票数 9

3回答

免费还是实惠的OCR和ICR (手写识别) SDK？

、、、、

我希望将OCR和ICR识别功能集成到我们正在构建的用于扫描表单和其他此类文档的业务应用程序中。我搜索了几个小时，找到了Abbyy、IRIS和其他几家以4位数价格销售SDK的公司。你知道有什么OCR/ICR引擎是免费的或便宜的吗？

浏览 2提问于2011-08-24得票数 5

回答已采纳

1回答

从可搜索的pdf中读取，不带ocr

我目前正在使用扫描仪将我的PDF转换为可搜索的PDF。OCR已经处理好了，因为我可以在PDF中使用ctrl-f。但是，我如何才能从我的程序中获取OCR的内容。我对使用java和ruby持开放态度，这个问题是编程语言不可知的。是否可以通过读取文件来公开访问OCR文本？

浏览 1提问于2011-12-15得票数 0

2回答

开源希伯来语OCR

、、

Linux中有免费的希伯来OCR吗？Hocr不算，因为它的质量太差了。我发送计算机生成的文本(不是扫描，只是保存作为一个gif)通过它，它不能捡到任何东西。 📷 对于OCR来说，这似乎是一个相当简单的图像。这些天来，它看起来不像一个CAPTCHA，但我听说OCR能够解析它们。如果是这样的话，这个图像就更加如此了。没有曲线，线切割文本等，但hocr不能OCR它。如果不是，至少要一些可训练的东西(我给它500个字母，然后它将在此基础上做OCR )。

浏览 0提问于2015-07-17得票数 10

1回答

如何在perl中安装PDF::OCR2模块？

、、、

我正在尝试使用perl从扫描的PDF中获取文本，所以我在perl中使用了PDF::OCR2模块，但我无法安装此模块，安装Image::OCR::Tesseract模块失败，我使用的是CentOS7，这是我在安装过程中的错误。 one dependency not OK (Image::OCR::Tesseract); additionally test harness failed /usr/bin/make test -- NOT OK //hint// to see the cpan-testers results for installing this module, try:

浏览 17提问于2016-08-19得票数 0

2回答

在TextReconiger实例化期间，如何处理由于Google Ocr lib而导致的应用程序本机崩溃？

、、、

我正在使用谷歌的OCR库从我的应用程序中检测图像中的文本。早些时候，它工作得很好，但突然开始出现错误。我在TextReconiger上实例化的时候崩溃了。我在三星S6 edge，三星S7等设备上遇到了这种崩溃，在一些设备上它工作得很好。在我的代码中，这一行出现了崩溃。 TextRecognizer textRecognizer = new TextRecognizer.Builder(context).build(); 崩溃日志： native: pc 000000000006f9fc /system/lib64/libc.so (tgkill+8) native: pc 0000

浏览 1提问于2017-11-09得票数 3

1回答

适用于.net的免费OCR SDK，可将文本、表格和图像提取到Office word文档中

、、

我想有一个免费的OCR SDK，可以提取文本，表格与数据和图像从扫描的文件(.tiff，.png等)，并存储到Office Word文档文件。请帮我把这个问题删掉。我已经做了提取文本只从图像使用莫迪，但不能得到的方式使用莫迪如何提取表格和图像，并存储到Office Word文档文件。

浏览 5提问于2011-08-12得票数 3

1回答

使用解析云代码中的Google Drive文档OCR

、、

我想建立一个使用离子/解析的应用程序，允许我用移动设备相机拍照，并对图像进行文本处理。据我所知，开源库有点挑剔，所以为了原型的目的，我希望使用Google Drive的OCR功能。用户可以拍摄文档的图片，我的云代码会将图片发送到google drive，执行ocr，在ocr成功时，该图片将被发送回我的Parse数据库。我正在寻找一些关于这个approach...Is的智慧，这是现实的还是我只是完全失去了我的摇滚乐？有没有集成这两件事的服务呢？我是否会像尝试集成一个开源OCR库一样，浪费同样多的时间让它工作呢？从实现的角度来看，我会遇到身份验证/数据格式/您遇到的问题吗？希望有一些，已经尝

浏览 0提问于2016-01-24得票数 0

2回答

iphone中的OCR检测

、、

可以在iphone中进行OCR检测吗？如果是这样的话，谁能提供链接，帮助我在iphone中开发OCR识别？谢谢Rakesh

浏览 3提问于2012-03-14得票数 1

回答已采纳

2回答

是否可以通过编程方式从视频中提取文本？

、

我知道我们可以用ocr从图像中提取文本。但是我需要提取视频中的文本，就像视频演讲中的文本一样。换句话说，是否有可能将视频转录成文本。这有可能吗？如果是的话，请建议我如何使用java或任何其他语言。

浏览 5提问于2017-07-15得票数 0

3回答

Vuforia文本识别与OCR的区别？

、、、、

谁能告诉我Vuforia文本识别和OCR的区别是什么？是一样的吗？我有点困惑，因为我发现Vuforia不需要捕获任何图像就可以识别文本，而OCR应用程序(如Tesseract )则要求用户捕获文本，图像识别文本。谢谢。

浏览 1提问于2013-11-03得票数 1

回答已采纳

1回答

如何使用光学字符识别扫描仪或MobileFirst平台提供的任何应用程序接口扫描和读取银行支票上的MICR码？

、、、、

我的一个android项目需要一个OCR阅读器功能来读取银行支票叶子上的MICR代码。我们已经尝试了一个android原生应用程序的示例代码，它可以扫描页面并读取最多不同类型的字体。但当扫描MICR代码时，应用程序无法读取数字，并给出完全不同的数字。请建议在MobileFirst平台中是否有任何可用于光学字符识别扫描的功能，如果可能，请分享示例代码。请告诉我能否通过OCR扫描仪读取MICR代码？

浏览 3提问于2016-02-11得票数 0

1回答

ahk - ocr使用camerb的库失败

、

我认为摄像头的库工作不是很好，你可以在下面的图片中看到ocr的结果：如果我尝试对一个数字进行ocr，尤其是浮点数，通常无法识别逗号，而"0“与"o”交换，则会得到相同的结果:( 有人知道更有效的库吗?答案是...thanks。如果你想尝试camerb的库，你可以在这里下载它：

浏览 1提问于2013-10-22得票数 0

1回答

用于与程序集成的免费、燃烧速度OCR软件

、、、、

我需要做光学字符识别在某一窗口的特定位置，以作出一个附加的应用程序。该应用程序是一个用HGE编译成可执行文件的C族游戏。有什么好的OCR解决方案吗？它需要能够在秒或毫秒内处理屏幕上的所有文本。我在处理几种不同的字体，每种字体都是一样大小的，总是这样。几种不同的颜色。有些文本具有一致的颜色或渐变背景，但大多数没有。 OCR应该在Windows 10或最新的Ubuntu上运行。是否有任何OCR程序，我可以提供字体数据？图像还是ttf？

浏览 0提问于2015-06-26得票数 5

2回答

计算OCR精度

、、、

我需要计算OCR字符的准确性。样地值： Non sinking ship is friendship 示例ocr值输入 non singing ship is finedship 令人关切的领域是：遗漏字符额外字符错位字符字符准确性是由实际字符的数量定义的，其位置除以实际字符的总数。我需要一个python脚本来找到这种准确性。我的初步实施如下： ground_value = "Non sinking ship is friendship" ocr_value = "non singing ship is finedship" gr

浏览 5提问于2020-08-22得票数 2

回答已采纳

1回答

想要Java代码创建

、

有人能给出一些示例代码或想法如何从图像中获取数据吗？我的图像是一个扫描的OMR表，我想阅读内容，文字输入，以及标记的气泡。这样我就能评估全表的答案。我不希望*使用ocr工具或已经可用的ocr阅读器。*我希望创建我自己的omr阅读器和检查器。所以请帮助我。提前谢谢你。

浏览 2提问于2012-09-27得票数 0

3回答

日本最精确的开源OCR？

、、

根据您的经验，什么是最准确的开放源码光学字符识别(OCR)库/软件来读取日文文本？我刚试过nhocr，它的错误率超过2%，即使是在一个非常干净的高清晰度文档上(2%用于大字体的超干净字符，对于扫描过的书籍则更糟糕，更不用说手写形式了)。日本旧手机(特别是夏普手机)在10年前就有了很好的日本OCR，所以我想它在开源中也是可行的。

浏览 0提问于2015-02-03得票数 6

2回答

Abbyy Finereader命令行用法/ python用法？

、、、

我有一个项目，需要扫描某些图像与光学字符识别。我知道abbyy finereader软件做得很好(也尝试了一个对我来说几乎完美的试用版本)，现在我想知道如何将这个软件嵌入到python或其他脚本语言中，这样我以后就可以简单地运行命令行脚本，例如python the_script.py image.jpg以获取图像作为参数，使用它执行abbyy finereader并返回识别的文本。我在谷歌上找不到方法，是不是没有！？我只找到了这样的东西：，但不知道它到底是做什么的…… 或者我需要哪一个abbyy软件才能做到这一点！？识别服务器或者OCR引擎或者其他什么东西？提前谢谢你

浏览 3提问于2014-02-19得票数 7

回答已采纳

1回答

基于CBIR和OCR的图像比较

、

负责从给定图像检索内容的项目，并与存储库中的其他图像进行比较，并列出匹配的图像。什么应该是正确的方法去做它，这样搜索最终不会放缓。作为第一层过滤，我计划做的是使用任何图像查询(CBIR技术)来检索与给定图像模式匹配的图像。然后执行OCR以获取图像内容并进行匹配检查。如果有更好的方法，请告诉我。

浏览 9提问于2015-08-31得票数 1

回答已采纳

1回答

PHP形状/图案识别内部图像

、、

我想得到一些提示/片段，如何在PHP的帮助下识别图片中的所需形状/图案。我想要裁剪包含身份证的图像的固定区域(使用百分比)，但要做到这一点，首先我必须检测身份证的边界并裁剪图像，以便除了卡片外，图像中将没有任何剩余。图片中的身份证不会旋转(不超过几度)，背景可能会有所不同。我的最终目标是使用OCR的裁剪区域。我认为，这种方法将很好地删除不需要的部分，也有助于OCR。如果你有更好的主意，告诉我。

浏览 0提问于2014-08-26得票数 2

11回答

免费的OCR软件，使PDF可搜索(与可搜索的文本在正确的地方)

、、、、

是否有任何免费的OCR软件(用于Linux和/或Windows)可以像Acrobat那样将PDF扫描文档作为输入并输出可搜索的PDF？使用可搜索的PDF格式，我的意思是OCRed文本在原始文本上是不可见的，可以用鼠标选择并复制。我知道Linux上的gscan2pdf可以这样做，但是文本被放置在页面的左上角，而且太小了，与背景扫描页面上的文本完全不同步。这是因为gscan2pdf将整个页面提供给OCR引擎。它应该将图像分解成小图像，用单行文本或小段落发送到OCR软件。

浏览 0提问于2014-04-20得票数 72

回答已采纳

1回答

php Tesseract错误！找不到命令"tesseract“

、

我正在尝试使用tesseract php，但失败了。我得到了这个错误： Fatal error: Uncaught thiagoalessio\TesseractOCR\TesseractNotFoundException: Error! The command "tesseract" was not found. Make sure you have Tesseract OCR installed on your system: https://github.com/tesseract-ocr/tesseract The current $PATH is C:\Wind

浏览 261提问于2020-10-05得票数 1

2回答

如何在阿尔卑斯Linux中安装Tesseract 3.04 (旧版本)？

、、

在我的Dockerfile里，我 RUN apk update && apk add tesseract-ocr=3.04 与下列错误有关的错误： unable to select packages: tesseract-ocr-4.1.3-r0: breaks: world[tesseract-ocr=3.04] 我也尝试过add tesseract-ocr=3.04.01，页面就是这样列出的。简单的add tesseract-ocr安装4.13版本，但我特别需要3.04。

浏览 11提问于2021-12-13得票数 1

1回答

扫描pdf至doc

有没有人知道是否有一个免费的在线OCR转换器，可以转换大扫描的pdf文件(例如，我想转换一个扫描的28 of大小的pdf文档)？我试过很多ocr转换器，但都失败了。

浏览 0提问于2016-01-17得票数 0

1回答

从索引中忽略非英语单词

我有一个带有文本元素的xml，它保存从OCR读取的文本。OCR读取的文本并不总是准确的，因此有时会出现拼写错误的英文单词。有没有一种方法可以指定只对英语词典中的单词进行索引。

浏览 1提问于2015-03-03得票数 0

1回答

OCR分析获取复选框或单选按钮值

、、、

我需要解析OCR图像文件并获取所有文本和复选框值，如何从OCR解析中获取复选框或单选按钮值，以及哪一个OCR Api给出了从图像中提取的校正结果。

浏览 3提问于2014-03-01得票数 2

1回答

ImageMagick用于检测数字

我很想知道ImageMagick是否能检测到图像中的数字？如果可以这样做，那么编写代码的最佳方法是什么？如果ImageMagick不能这样做，还有其他方法来检测图像上的数字吗？编辑:我不寻找一个OCR程序或使用OCR程序。我已经使用OCR通过杂技，如果它是一个独特的真实类型或opentype字体，OCR进程将破坏图像。

浏览 0提问于2013-02-04得票数 0

回答已采纳

3回答

如何在扫描图像中搜索著名的徽标？

、、、、

我有以下扫描的文件，上面有标志，我有另一个具有相同标志和风格的黑白图像(显示在下面的黑白颜色)。如何确保徽标出现在此图像上？通常我会有许多扫描的文档，OCR会拾取MTNL，但有时这些徽标只是由OCR不易识别的符号组成。徽标的大小和位置会发生变化，它们并不是固定的。它们可以放在文档的任何位置。我想根据当前的徽标和符号来组织和编目扫描的图像。大多数文档可能是英文的，也可能不是英文的，可能包含也可能不包含任何条形码，在这种情况下，徽标匹配将有所帮助。我见过Aforge.NET库，但我不太确定应该结合哪种方法来进行搜索。像素搜索非常慢，如果源目标的大小不同，则会失败。我听说You

浏览 6提问于2012-09-25得票数 8

3回答

用于阿拉伯语的开源OCR库

、、、

我四处寻找一个OCR库-最好是开源的-我可以在一些阿拉伯语pdf上使用它。在谷歌上搜索也没有找到任何有用的东西。我想知道是否有人知道相关的OCR库，甚至可以在相关语言(波斯语和乌尔都语可能是相关的)上工作的库，可以添加阿拉伯语支持。任何关于如何实现这一点的一般性建议都将不胜感激。

浏览 5提问于2011-01-15得票数 15

3回答

数学公式的OCR

我计划创建一个程序，通过使用OCR将方程导入Wolfram Alpha，然后从那里显示一步一步的解决方案，从而为数学课本中的问题生成工作解决方案。方程就不会太复杂了我想知道是否有合适的OCR程序(最好是FOSS)或API能够处理这些方程。

浏览 3提问于2017-10-20得票数 3

1回答

OCR中的特征提取:对这些特性有什么想法吗？

、

有没有人知道下面这些特性是什么，它们被用于OCR中的特征提取级别。垂直扫描中图像绝对像素差的最大个数水平扫描中图像绝对像素差的最大个数图像中连续像素绝对差的总和。我真的很感激你的帮助。

浏览 1提问于2012-07-28得票数 0

1回答

MODI内存泄漏

、、、

我有一个应用程序，我正在使用MODI 2007来OCR几个多页的tiff文件。我发现，当我在一个包含几个好的tiffs，但也有一些无法在Windows图片和传真查看器中打开的tiffs的目录上启动时，MODI也无法OCR这些“坏”的tiffs。当这种情况发生时，应用程序无法回收MODI用于OCR这些tiffs的任何内存。在工具尝试OCR太多这样的“坏”口角之后，机器就会耗尽内存，应用程序就会崩溃。我已经尝试了网络上的几个代码修复程序，它们应该可以修复任何MODI内存泄漏，但到目前为止还没有一个对我有效。我粘贴了以下代码的一部分，它执行OCRing： String

浏览 5提问于2010-04-23得票数 0

3回答

使用OCR从图像文件中读取文本的API

、

我正在寻找Java中的OCR (光学字符识别)的示例代码或API名称，使用它我可以从图像文件中提取所有文本。没有比较它与任何图像，我正在做使用下面的代码。 public class OCRTest { static String STR = ""; public static void main(String[] args) { OCR l = new OCR(0.70f); l.loadFontsDirectory(OCRTest.class, new File("fonts")); l.lo

浏览 0提问于2014-03-20得票数 9

1回答

与Java Applet交互

、、

有没有人知道是否可以通过.net与java applet进行交互？编辑:我能够使用UI Automation框架定位java applet，并从那里使用OCR读取数据并模拟鼠标/键盘输入到applet中。

浏览 3提问于2009-01-29得票数 2

回答已采纳

1回答

从Azure Cognitive Services Read返回OCR格式的PDF文件(带有文本覆盖)

、

我已经实现了Azure Cognitive Read服务来返回PDF中提取的/OCR文本。但是，为了使用户更容易理解上下文/从PDF复制和粘贴数据，我想将该文本数据覆盖在PDF上。然后我会将该PDF放入查看器中。有没有人知道该怎么做。也很乐意使用AWS。基本上，一个API，我提交了一个PDF，它返回一个OCR的PDF是我要找的。如果这是不可能的，一个库，我可以提交文本和PDF (并返回一个文本可搜索的PDF)也是理想的。

浏览 1提问于2021-07-23得票数 1

1回答

tess-两个OCR无法正确解码

、、

我按照教程来安装Tesseract，特别是tess-two和eyes-两个安装和我的Android应用程序的一部分。它可以运行，但从baseApi.getUTF8Text();返回的OCR文本完全是胡言乱语。 BitmapFactory.Options options = new BitmapFactory.Options(); options.inSampleSize = 4; Bitmap bmp = BitmapFactory.decodeFile(path , options); receipt.setImageBitmap(bmp);

浏览 1提问于2015-05-14得票数 0

7回答

如何使用Microsoft库( Microsoft.Windows.Ocr )在ASP.Net MVC4 Web项目中？

、、、、

TL;DR：是否有人知道如何在服务器端的Microsoft.Windows.Ocr WindowsPreview.Media.Ocr.dll 应用程序(如MV4 Web )上引用 (/ )程序集，并利用该程序集中的OCR功能将照片图像作为输入并从中提取文本内容?如果是，请在回答中提供详细说明。质问细节(以及我迄今尝试过的) 我正在构建一个web应用程序，它接收上传到服务器的图像(通过文件上传UI屏幕)，然后使用OCR读取文本，并在下一页显示文本，就在上传的图像旁边。由于大多数商业OCR库都要花费一定的成本()，我想我可以尝试使用Microsoft OCR Library Microsof

浏览 9提问于2014-11-29得票数 25

1回答

基于贝叶斯分类的数字识别

、

我只需要为数字写一个OCR程序。我将使用MNIST数据集。问题是我不知道从哪里开始。有很多论文并没有真正解释算法。我对模式识别并不是很了解。所以我有几个问题。 Q1 :在哪里可以找到算法(或教程) Q2 :如何对数字进行分类？我不需要非常高级的东西。我首先想到的是找出上半部分/下半部分和左侧/右侧的比例。有没有更有用和更简单的分类方法。Q3 :什么是反向传播和层，这在大多数论文中都有介绍。我的简单的OCR需要它们吗？注意:我知道我的OCR程序不会准确。就目前而言，这并不重要。

浏览 0提问于2011-11-18得票数 6

回答已采纳

1回答

复杂文档的OCR扫描

、、、

我需要创建一个工具，将使用高质量的相机，以扫描特定的文本块从文件和OCR他们。每个文档都匹配相同的模板，其中包含几个填充了数据的表。我需要从每个扫描文档中提取一个特定单元的数据。我需要考虑旋转和轻微的图像转换。整个工作流应该如下所示：文档被“显示”给摄像机。软件制作文件的图片。软件占了一些小的旋转和其他转换(小剪切，缩放，旋转可能发生，因为文档是掌握在手中)。软件识别正确的模板文档正在显示，并从特定的单元格中提取图像。然后图像是OCR。基本上，我不需要一个最终的解决方案，而是一些方向，从哪里开始寻找。我知道如何对纯文本执行OCRing，我不知道的是如何实现步

浏览 3提问于2012-04-08得票数 1

回答已采纳

1回答

使用pypdfocr的Alfresco上的OCR文件

、、、、

我不能在Alfresco上使用pypdfocr的OCR文件。大家好，我是从Alfresco开始的，我在Al新鲜it中配置pypdfocr并使用它时遇到了一些困难。我在Ubunto 18.04.5LTS上安装了Alfresco，使用如下所示： wget https://download.alfresco.com/release/community/201707-build-00028/alfresco-community-installer-201707-linux-x64.bin 我已经完成了所有必要的配置，在各自的文件夹中添加了文件repo.jar和share.jar： /opt/alf

浏览 9提问于2020-08-30得票数 0

回答已采纳

1回答

建议摄像机用于自动测试中的屏幕捕捉

、

我最近为一个手持式示波器编写了一个自动固件测试，在这里我使用自己的屏幕截图功能获得屏幕截图，然后使用OCR软件处理图像。现在我被要求将这个测试移植到手持数字万用表上。看起来像这的东西。问题是HHDMM没有内置的屏幕截图功能。所以我计划在屏幕上安装一个摄像头来获取截图图像。然后，图像必须由个人计算机自动检索，以便进一步处理。我以前没有经验或知识的相机选择为这种类型的目的。有人能教我这个吗？

浏览 0提问于2015-10-23得票数 3

回答已采纳

1回答

解析传真表单

、、

看一下这样一种场景，其中表单(为了简单起见，仅包含复选框)被传真到能够进行OCR的传真服务器。现在，对于排版文本，我已经看到各种OCR实现都做得不错，但我不确定它将如何处理复选框，尤其是手写的"x“或检查，更不用说坐标了。回到小学，我们常常在正确答案中填入HB铅笔阴影的高斯(原文如此)测试；不知何故，这会被解析和分析。我们今天在哪里？有没有开箱即用的东西？

浏览 0提问于2010-09-02得票数 1

回答已采纳

1回答

从PDF格式的图像中提取文本

、、、、

假设我的用户去了他们办公室的扫描仪。扫描仪能够生成扫描文档的PDF。这基本上就是我所拥有的文件类型。我想要做的是从这个PDF中提取文本。这不是一个“第一代”pdf的意义上说，文本没有嵌入到pdf中。文本嵌入在PDF中的图像中。 iText of PDFBox中是否有允许检索此数据的功能？如果可能的话，我尽量避免在图像上做OCR。我希望在IText或PDFBox中有一些东西可以做到这一点。请注意，我不是在讨论从pdf中提取“正常”文本，如下所述：

浏览 5提问于2015-08-18得票数 2

回答已采纳

3回答