ocr光学技术_ocr光学字符识别图片技术_ocr光学 - 腾讯云开发者社区

、、

我有几个包含文本的图像，我想在上面执行OCR，但问题是一些图像是双语的，包含英语和阿拉伯语文本，还有一些是纯英语。我怎样才能检测到这些双语页面？我只想要英文的OCR。

浏览 1提问于2016-03-10得票数 0

5回答

是否有OCR无法识别的字体？

我正在试着写一个只能被人读懂的文档。无法复制文档内容。为此，我将其页面转换为图片，并将其添加回PDF文件。主要的问题是，任何OCR程序都可以恢复整个书面文本，特别是页面将是清晰的(而不是扫描的书)，这将提高OCR的准确性。那么，有没有OCR无法识别的字体呢？否则，有没有一种技术可以让我的文档只被人类阅读，而不被OCR识别？(例如，添加特定的背景，等等) 提前谢谢你。

浏览 3提问于2012-11-13得票数 4

回答已采纳

1回答

我可以获得与特定文件关联的关键字列表吗？

也就是说，对于执行OCR的图像，我希望能够获取图像上的文本列表。使用SDK可以做到这点吗？如果是这样的话，如何使用google的OCR来获取图像中的单词，如果没有，有什么建议吗？

浏览 1提问于2012-07-03得票数 25

回答已采纳

5回答

有没有适用于Android的免费OCR库？

、

我正在寻找在Android上运行的Java OCR，然而Asprise似乎不是一个独立于平台的OCR。有没有开源/免费的Java OCR可以用来开发android应用程序？

浏览 49提问于2009-07-09得票数 149

3回答

是否有OCR的行业标准输出格式？

、

是否有OCR的行业标准输出格式？我似乎找不到任何被定义为行业标准的东西，我对OCR也不是很有经验，所以我也不知道是否有标准。

浏览 3提问于2013-06-04得票数 1

回答已采纳

1回答

OCR分析获取复选框或单选按钮值

、、、

我需要解析OCR图像文件并获取所有文本和复选框值，如何从OCR解析中获取复选框或单选按钮值，以及哪一个OCR Api给出了从图像中提取的校正结果。

浏览 3提问于2014-03-01得票数 2

1回答

我正在寻找布局分析库或工具(最好是开源的)，可以应用于文本PDF，以识别主要文本内容与侧栏，章节标题，章节标题(甚至可能是具有装饰/阴影和下划线的花哨的标题)等。我遇到了像OCRopus这样的工具，它们使用光学字符识别和图像识别来识别布局。有没有库可以在没有OCR的情况下做同样的事情？可以从文本PDF中提取文本和图像，并将包含文本和图像位置的输入提供给该工具；对于此类文件使用OCR将是相当繁琐的。

浏览 2提问于2013-05-08得票数 2

回答已采纳

3回答

在Automation Anywhere中IQ机器人是什么？

、、、

在Automation Anywhere中IQ机器人是什么？我真的很困惑，因为Automation Anywhere的前一个版本已经有了OCR和图像识别的能力，它的区别是什么？

浏览 0提问于2019-10-17得票数 0

1回答

谷歌翻译手机应用程序是否使用Tesseract在本地进行OCR？

、、、、

与我在iOS上用Tesseract写的一个测试相比，这个应用程序在光学识别方面超级快速和准确。所以我想知道: Google翻译手机应用程序是否使用Tesseract在本地进行OCR？或者它调用了一些Google后端，比如Google Drive API，它们支持OCR。谷歌或该团队的人知道吗？

浏览 0提问于2016-03-23得票数 2

1回答

用于OCR的android phonegap插件

、、、、

我正在寻找一个安卓版本的PhoneGap光学字符识别插件。不幸的是，我不能使用ocr-api-service，因为OCR库必须是本地的。然后我找到了这个。不幸的是，它只适用于ios。所以我想知道是否有这样的插件存在。谢谢

浏览 3提问于2013-03-22得票数 2

回答已采纳

1回答

从可搜索的pdf中读取，不带ocr

我目前正在使用扫描仪将我的PDF转换为可搜索的PDF。OCR已经处理好了，因为我可以在PDF中使用ctrl-f。但是，我如何才能从我的程序中获取OCR的内容。我对使用java和ruby持开放态度，这个问题是编程语言不可知的。是否可以通过读取文件来公开访问OCR文本？

浏览 1提问于2011-12-15得票数 0

1回答

从中文文档中提取数据

、、、、

workfusion是否支持使用OCR和机器学习从中文文档中提取数据。敬请指教。致敬，Sunil Prabakar C

浏览 2提问于2019-09-11得票数 0

2回答

使用Tesseract读取简单字母

、、

int main() { cv::Mat lettersmat = cv::imread("letters.jpeg", cv::IMREAD_GRAYSCALE); cv::threshold(lettersmat, lettersmat, 128, 255, cv::THRESH_BINARY); tesseract::TessBaseAPI* ocr = new tesseract::TessBaseAPI(); if (ocr->Init(NULL, "eng", tesseract::OEM_L

浏览 2提问于2021-02-02得票数 0

2回答

屏幕文本的OCR (光学字符识别)

、、、

我正在尝试创建一个软件，通过捕获屏幕截图，然后OCR (光学字符识别)它寻找一个特定的按钮来点击(例如)的PC自动化。我已经得到了鼠标和键盘控制部分，但现在，我需要一个OCR来处理屏幕截图。我发现Tesseract OCR似乎不能很好地处理屏幕上的文本。文本要么太小，要么一些文本似乎是连接在一起的，比如K和X。我该怎么做呢？ p/s:这是一个自动化测试程序。

浏览 1提问于2009-05-22得票数 4

3回答

java的任何OCR技术

、

我有MCA最后一年的项目，以提取数据从图像(jpg，gif等)。我想从图像中识别数据。我已经使用了java ocr，但它不工作。有没有可以帮到我的开源库？

浏览 0提问于2010-03-10得票数 0

2回答

在mac上安装asprise_ocr_sdk_python_api后，得到"No module named 'ocr'“

、、、

我两个都跑了 sudo pip install asprise_ocr_sdk_python_api pip install asprise_ocr_sdk_python_api 收到消息 "Requirement already satisfied: asprise_ocr_sdk_python_api in /Users/myid/miniconda3/envs/competition/lib/python3.5/site-packages" 但是当我运行asprise_ocr进行测试时：出现以下错误： Traceback (most recent call last)

浏览 6提问于2017-07-21得票数 1

1回答

有人知道一个工作的OCR (PHP)吗？

、

可能重复：我已经找了将近3天的OCR类(必须是PHP)。有人知道工作的OCR吗？如果您有OCR样品，请指导我。

浏览 1提问于2011-01-26得票数 3

回答已采纳

1回答

带有Aspris库的java - OCR

、、、

这是我使用Aspris库编写的代码，但"recognize“方法有问题： Ocr.setUp(); Ocr ocr = new Ocr(); ocr.startEngine("eng", Ocr.SPEED_FASTEST); String s = ocr.recognize(theImage, Ocr.RECOGNIZE_TYPE_ALL, Ocr.OUTPUT_FORMAT_PLAINTEXT); ocr.stopEngine(); "theImage“是位图，但他们想要"RenderedImage”类型(虽然位图也是渲染的)，"recogn

浏览 3提问于2015-08-14得票数 0

3回答

delphi ocr:我应该使用什么libabry？

您好，是否有人已经在Delphi中使用了OCR activex/Dll/库？我找不到用于OCR的库(免费或价格合理) 问候

浏览 5提问于2010-10-28得票数 2

回答已采纳

1回答

Python PIL图像转文本无法正常工作

、、、、

下面是我的python脚本，用于读取图像上的文本。但它不能正常工作，因为后来的t被理解为+或f.I想知道如何处理这个问题吗？我还附上了我正在尝试读取的文件。 import tesserocr from PIL import Image print tesserocr.tesseract_version() # print tesseract-ocr version print tesserocr.get_languages() # prints tessdata path and list of available languages image = Image.open('t

浏览 0提问于2017-03-26得票数 0

2回答

OCR中的滑动窗口耗费大量时间

、、、、

我正在实施滑动窗口技术来开发照片OCR，即从图片中剪切一个特定大小的矩形，并检查它是否包含文本。然后，矩形再次被移动了一些像素。但是这种滑动窗口技术需要花费大量的时间。例如，处理1366x768的图片需要6个小时，步长为2，窗口大小为20x25。有没有其他技术可以帮助或如何加快这一过程？我正在用java编写代码。

浏览 2提问于2012-11-27得票数 1

回答已采纳

1回答

在Android中集成Tesseract OCR引擎

、、

我们如何在我们的安卓项目中使用Tesseract OCR引擎来读取image..how中的字符?我可以在安卓上安装它吗？请帮帮忙

浏览 1提问于2011-03-15得票数 1

3回答

OCR是如何工作的？以及如何将OCR添加到字母表

、、

我有一个以前没有处理过的字母表，所以当扫描时，没有办法用OCR来检测要识别的字母。我正在尝试为它编写OCR程序，但在这方面没有太多经验。对于从哪里开始，以及这样的系统通常是如何实现的，我希望能得到一些提示。

浏览 0提问于2012-02-24得票数 3

1回答

谷歌云存储支持OCR？

、、

Google Cloud Storage有一个搜索机制来使用OCR (光学字符识别)来查找图像文件吗？例如，有可能在谷歌云存储中搜索图像文件文档，按其内容？就像在Google Drive里一样。

浏览 0提问于2015-06-27得票数 0

1回答

Android的OCR应用程序

、、、、

我正在开发一个项目，以开发一个应用程序，以执行在Android手机上的英文文本OCR。我希望使用现有的开源OCR引擎。比如tesseract。有谁能帮帮我吗？给我指个正确的方向？这是我的第一个项目。

浏览 0提问于2010-02-18得票数 0

1回答

解析传真表单

、、

看一下这样一种场景，其中表单(为了简单起见，仅包含复选框)被传真到能够进行OCR的传真服务器。现在，对于排版文本，我已经看到各种OCR实现都做得不错，但我不确定它将如何处理复选框，尤其是手写的"x“或检查，更不用说坐标了。回到小学，我们常常在正确答案中填入HB铅笔阴影的高斯(原文如此)测试；不知何故，这会被解析和分析。我们今天在哪里？有没有开箱即用的东西？

浏览 0提问于2010-09-02得票数 1

回答已采纳

1回答

适用于Office 2016的Microsoft Office Document Imaging (MODI)

、、、

我听说过MS Office2007中的扫描文档OCR功能。是否有与Office 2016兼容的功能相似/相同的类似程序？

浏览 32提问于2018-10-30得票数 0

回答已采纳

1回答

查找表单和文档的OCR SDK

、、

我公司想用java开发一个基于OCR技术的文档管理项目。有OCR开发经验的人可以推荐哪种OCR SDK更好？

浏览 1提问于2010-11-02得票数 5

1回答

Howto:使用C#在光学字符识别前提高PDF质量

、、、

我正在创建一个服务，用于监视文件夹中的扫描文件。一旦文件存在，该服务就会提取它，并将其转换为可读的PDF。在此过程中，该服务还会搜索条形码。在此之后，提取文本，并将文件及其文本存储到我们软件的数据库中。该位置基于条形码。现在，对于光学字符识别，我们使用了Atalasoft的SDK ()。此外，条形码识别器也包含在此SDK中。但是转换后的文本仍然有一些错误。(我用其他OCR程序运行了一些测试，但Atalasoft运行得很好。)我正在寻找一些软件(SDK-套件)，可以让我提高的质量的PDF的OCR的目的。我测试了Kofax ()。我正在寻找类似的东西，但这可以使用某种SDK-kit在服务中实

浏览 2提问于2011-07-06得票数 5

回答已采纳

1回答

使用特定字体的OCR扫描

、、、、

我正在为Android应用程序实现一个OCR扫描库，它不仅扫描数字，而且还扫描那些具有特定字体的数字，这是我在库中的某个地方手动定义的。我正在尝试实现"TESSERACT“库，但没有找到特定于字体的扫描实现。我使用以下代码来扫描OCR，而不是特定的字体。我的实现如下： private void processImage(Bitmap bMap, String imagePath) { try { datapath = Environment.getExternalStorageDirectory().getAbsolutePath() + &

浏览 2提问于2016-12-16得票数 2

1回答

Android获取图片和获取捕获图片中的文本

、

我正在尝试制作一个应用程序，通过使用android来拍摄图像，然后从捕获的图像中获取文本(它可能像OCR一样)。如果有人知道这件事，请帮帮我。谢谢。

浏览 0提问于2012-10-31得票数 0

1回答

OCR为什么不只查找字符

、

我使用OCR puma.net，我得到了一个结果。但结果不仅包含(a b c d)，还包含(; / , ")。我只想输出这些字符。我怎么使用它？下面是我的代码： var puma = new PumaPage(img.ToBitmap()); using (puma) { puma.FileFormat = PumaFileFormat.RtfAnsi; puma.EnableSpeller = false; puma.Language =

浏览 3提问于2015-11-22得票数 0

1回答

如何使用人工智能开发光学字符识别器？

、、

我已经开发了一种OCR，它完全致力于字体和大小。我只是用来计算字体的高度和宽度，找出我与数据库值比较的比率，然后选择字体。我想将逻辑扩展到所有类型的字体和大小。我想用人工智能来做。我看过一些开源OCR的编码。但是，它不会有什么用处。请指导我应该遵循/开始开发我自己的OCR的方法。我想让它成为一个全世界的Oper Source项目，也想为Java中进一步的项目具体开发提供API。提前谢谢。

浏览 1提问于2012-04-30得票数 4

回答已采纳

2回答

在Android上使用Google Docs OCR做其他事情

、

我正在考虑用我的android手机从文档中捕获一些文本，并在android上寻找一个理想的OCR应用程序。我今天碰巧看到Google推出了OCR，用于扫描可以在Google Docs中编辑的文档。我想知道我是否可以使用OCR来做一些事情，而不是将文档转换为Google Docs -比如，拍摄证书的照片，捕捉候选人的姓名和出生日期，或者拍摄车牌照片，并能够以文本形式获得可以存储的信息。如果有人知道如何使用谷歌的OCR在Android上实现这一点，那将是一件很棒的事情。我确实读过关于Tesseract/Tesjeract的文章，但使用它实现我想要的东西似乎非常困难--也许我没有完全理解如何通过J

浏览 1提问于2011-04-28得票数 4

1回答

将日语支持添加到OCR | RPA

、、、、

如何使用OCR添加Japanese language？我想知道language files的位置以及如何选择它们。

浏览 15提问于2020-02-24得票数 2

回答已采纳

1回答

视频中的OCR？openCV或使用光学字符识别的图像处理？

、、

我必须写一个程序，从司机前面的车内屏幕上拍摄的视频中进行OCR，所以它只对数字进行OCR。我正在努力寻找实现它的方法。我正在考虑使用openCV，但作为另一种选择，我正在考虑使用一个从视频中提取帧并找到数字的光学字符识别程序。但是许多OCR程序不能正确识别数字(也许OCR需要训练？)。所以我想使用计算机视觉库来完成这项工作。你认为实现这个简单程序的最好方法是什么？我认为使用计算机视觉库和匹配的模板会很好，但也可以帮助me.for例如有程序做车牌识别。所以任何建议都是受欢迎的。

浏览 6提问于2012-06-30得票数 5

回答已采纳

1回答

使用闪烁ID减少OCR时间

、、

我们一直使用blink id作为android的OCR工具。但在有环境光的情况下，第三方库扫描的时间太长，因为文档是层压的。有没有人知道通过锁定相机的焦距来减少扫描时间的方法。

浏览 1提问于2016-03-07得票数 3

1回答

ahk - ocr使用camerb的库失败

、

我认为摄像头的库工作不是很好，你可以在下面的图片中看到ocr的结果：如果我尝试对一个数字进行ocr，尤其是浮点数，通常无法识别逗号，而"0“与"o”交换，则会得到相同的结果:( 有人知道更有效的库吗?答案是...thanks。如果你想尝试camerb的库，你可以在这里下载它：

浏览 1提问于2013-10-22得票数 0

2回答

如何使用谷歌的AutoML进行光学字符识别

、、、

我想做OCR，我知道Cloud Vision API支持它。但我有兴趣为它制作我的自定义模型，并希望使用AutoML实现相同的效果。但是我在AutoML上找不到任何与光学字符识别相关的东西。是否可以使用AutoML进行光学字符识别？我们该怎么做呢？我知道这是一个非常开放的问题，但我希望能得到一些帮助。

浏览 32提问于2020-06-25得票数 0

回答已采纳

1回答

无法使用OCR检测数字

我尝试使用Azure Cognitive Services OCR获取数字及其在图像中的位置，但它无法检测图像中的任何数字。这是。(我使用的是来自的示例代码) 谢谢你，阿特

浏览 16提问于2017-07-03得票数 1

1回答

如何将tesseract中的语言首选项从英语更改为其他语言？

、、、

通过遵循，我成功地用英语(使用tesseract)为android构建了一个简单的ocr应用程序。现在它可以识别英文字符了。但是，如何才能将语言首选项从英语更改为其他语言呢？印度语系语言我已经下载了一种印度语言的训练数据，并用英语替换，并相应地修改了一些代码。但它并没有带来结果。

浏览 1提问于2012-12-29得票数 0

1回答

.net (C#) MVC与光学字符识别和提取所有特定的词，以存储到数据库中

、

我搜索了一个免费的.Net (MVC)库，我可以使用它从文档扫描仪扫描，然后对文档进行OCR，这样我就可以从中获取文本并保存到数据库中。例如，我扫描一份保险文档。然后我只想获取姓名和保险id，并将其存储到数据库中。

浏览 0提问于2018-06-01得票数 0

7回答

在OCR (光学字符识别)之前，您会推荐哪种软件来增强图像？

、、、、

我们目前正在研究在提交到OCR之前提高图像质量的方法。我们目前使用的OCR引擎是Nuance的Scansoft API (v15)。我们正在研究，但后来决定把目光投向别处。与Lead Tools相关的许可成本实在太高了。首先，我们正在寻找简单的图像增强功能，如:去偏斜，去斑点，去除线条，去除冲孔，锐化等。我们运行的是.NET和Java软件的混合，但java解决方案将是首选。

浏览 2提问于2008-09-27得票数 4

回答已采纳

1回答

如何提高iphone中OCR文本的质量

、、

我有一个来自github的OCR示例。但是文本的质量非常低。如何改进text quality....please很快就能帮到我。提前谢谢。

浏览 1提问于2011-07-29得票数 2

回答已采纳

1回答

从网格图像中提取文本

、、

我需要从网格图像中提取文本段以进行OCR。我尝试了多种方法，如HoughLines、连通分量、形态学运算等，但没有得到令人满意的结果。有没有人能建议一个更好的方法？我附上了几张样本图片

浏览 0提问于2018-03-21得票数 1

1回答

包含文本和图像页面的OCRing pdf

、、

我有下面的ubuntu脚本，它检查我的pdf是否已经OCRed，如果没有就OCRs，问题是，我有一些混合了OCR和非OCR的pdf。所以，我想在if语句中添加一个条件，如果行数或单词数少于某个数字(例如100行文本或1000个单词)，则对其进行OCR。我对ubuntu完全陌生，我已经添加了几行(粗体)。 MYFONTS=$(pdffonts -l 5 "$1" | tail -n +3 | cut -d' ' -f1 | sort | uniq) **LINECOUNT=$(wc -l)** if [ "$MYFONTS" = ''

浏览 2提问于2019-07-08得票数 0

2回答

asp.net中图像中的字符识别

、、

我想拍摄一张图片，并索引该图片中的单词，让用户搜索该图片，然后在关键字周围显示突出显示的图像。所以，我需要的是一个OCR类，它可以获取图像，并给我一个单词列表和它们的坐标？有可能吗？

浏览 3提问于2009-09-29得票数 2

1回答

tesseract-字符排序从图像中读取文本

、、

我需要使用Tesseract OCR读取文本，我需要从图像中获取字符位置，有任何方法可以完成这些任务，请帮助我。

浏览 0提问于2018-11-03得票数 0

回答已采纳

1回答

在python中从图像创建表

、

我以前从来没有用过OCR，我想知道有没有人可以推荐一个像样的python OCR，可以把下面的图像转换成2D数组？

浏览 0提问于2014-04-01得票数 0

2回答

javascript OCR API

、、、

我在找一种JavaScript OCR。例如:发送图片和预期的结果类型(例如，数字、对象、文本、混合等)，并以字符串或JSON形式接收结果。有没有人知道这样的接口/服务，你可以很容易地通过JavaScript访问？编辑:我忘了说，主要的用例是识别数字(如浮点数和双精度数)和价格(如0.02$)。我已经找到了一些像abbyy这样的"cloud-ocr API“，但它们很贵……每个请求2美分……

浏览 1提问于2012-11-23得票数 10

回答已采纳