ocr engine_arc engine_arcgis engine - 腾讯云开发者社区

、、

在做一台OCR。我可以导入asprise_ocr_api，并且我想在这方面工作： from asprise_ocr_api import * Ocr.set_up() ocrEngine = Ocr() ocrEngine.start_engine("eng") s = ocrEngine.recognize("1.png", -1, -1, -1, -1, -1, OCR_RECOGNIZE_TYPE_ALL, OCR_OUTPUT_FORMAT_PLAINTEXT) print("Result: " + s) ocrEngine.stop_e

浏览 53提问于2017-07-31得票数 2

回答已采纳

2回答

php exec()和tesseract说“无法打开输入文件”

、、

我使用Ghostscript将PDF文件中的图像剥离到jpg中，并运行Tesseract保存txt内容，如下所示：位于c:\engine\gs\Tesseract中的Ghostscript位于c:\engine\tesseract\web中pdf/jpg/txt =/tmp/ 代码： $pathgs = "c:\\engine\\gs\\"; $pathtess = "c:\\engine\\tesseract\\"; $pathfile = "file/tmp/" // Strip images putenv("PATH="

浏览 4提问于2012-04-17得票数 1

回答已采纳

1回答

OCR -使用tesseract 3.0和imagemagick 6.6.5从图像中获取文本

、、

我正在尝试构建一个shell脚本，它允许我搜索图像中的文本。基于文本，脚本将尽力从图像中获取文本。我想要你对此输入，因为这个脚本似乎适用于大多数图像，但不是那些文本字体颜色类似于文本周围较小环境的图像。 # !/bin/bash # # imt-ocr.sh is image magick tessearc OCR tool that is used for finding out text in image # # Arguments: # 1 -- image filename (with path) # 2 -- text to search in image

浏览 1提问于2012-08-16得票数 6

4回答

如何将find \ xargs一行代码重构为人类可读的代码

、、

我为tesseract和abbyyocr11编写了一个OCR包装批处理&服务脚本，在这里可以找到： main函数是一个find命令，它将其参数传递给带有-print0的xargs，以便处理特殊的文件名。find命令变得越来越复杂，最后成为一个很长的队列，变得很难维护： find "$DIRECTORY_TO_PROCESS" -type f -iregex ".*\.$FILES_TO_PROCES" ! -name "$find_excludes" -print0 | xargs -0 -I {} bash -c 'export

浏览 5提问于2015-10-02得票数 2

回答已采纳

1回答

Google Mobile Vision ocrlib.so文件下载错误

、、、

我在我的应用程序中使用Google Mobile Vision TextRecogniser API从捕获的图像中读取文本。但我每次都会出错。 I/Vision: Request download for engine ocr is a no-op because rate limiting I/Vision: Loading library libocr.so I/Vision: libocr.so library load status: false I/Vision: Request download for engine ocr is a no-op because rate lim

浏览 20提问于2020-01-17得票数 0

2回答

如何在PHP中使用tesseract_ocr？

、

我发现在php中使用tesseract_ocr有问题，我遵循本教程。我安装tesseract_ocr use： $ composer require thiagoalessio/tesseract_ocr 这是localhost中的我的文件夹结构：这是地形码： <!DOCTYPE html> <html> <body> <h1>My first PHP page</h1> <?php require __DIR__ . "/vendor/autoload.php"; use thiagoales

浏览 11提问于2020-05-01得票数 0

1回答

使用Movidius NCS2的OpenCV在使用Darknet神经网络时出现错误

、、、、

我正在尝试使用英特尔Movidius神经计算棒2执行光学字符识别。我使用的光学字符识别网络基于YOLO，因此将图形结构保存为.cfg文件，并将权重保存为.weights文件。我使用的是OpenCV，它与Openvino一起安装在Raspberry Pi 3b+上。我的代码如下： import cv2 # load network ocr_net = cv2.dnn.readNetFromDarknet('ocr-net.cfg', 'ocr-net.weights') ocr_net.setPreferableTarget(cv2.dnn.DNN_TARGE

浏览 5提问于2019-10-17得票数 0

1回答

如何在R中执行100%准确的OCR

、、

我正在尝试从图像中提取文本使用以下代码： txt = ocr("D:/office/ML_PR_1/check.png", engine = tesseract("eng")) filename = paste("DUMP/OCR", i, ".txt", sep = "") write(txt, filename) 输出文本为：观察到OCR将B读取为3或5，将BW读取为EV。

浏览 0提问于2017-06-12得票数 0

1回答

Tesseract OCR不输出文件

C:\Program Files (x86)\Tesseract-OCR>tesseract C:\wamp64\www\test.jpg C:\wamp64\www\test pdf Tesseract Open Source OCR Engine v4.0.0.20181030 with Leptonica Warning: Invalid resolution 0 dpi. Using 70 instead. Estimating resolution as 279 那是我的代码。未创建任何文件。我不知道这段代码是怎么回事。我在目录中是Tesseract OCR (C:\Prog

浏览 1提问于2018-11-11得票数 0

1回答

如何使tesseract-ocr识别IPA字母表中的字符？

、

我用下面的图像尝试了以下命令： $ tesseract image.png output tessedit_char_whitelist=ʌəɑɪʊɔæɜʒʃʧθŋʤð 产出如下： read_params_file: Can't open tessedit_char_whitelist=ʌəɑɪʊɔæɜʒʃʧθŋʤð Tesseract Open Source OCR Engine v3.05.01 with Leptonica libpng warning: iCCP: known incorrect sRGB profile 还尝试传递具有相同IPA字符的文件list.t

浏览 12提问于2017-09-29得票数 2

回答已采纳

1回答

使用R中的tesseract识别图像中的特定字符？

、、、、

我试图识别和删除心电图图像文件中的特定字符。在ECG中，出现的“单词”不是通常的英语单词，而是像"aVR“、"V5”、"II“这样的引号。下面是一个示例图像：我试图使用R中的tesseract包来识别和删除这些图像中的所有字符/数字，以便只留下心电图线。这就是我尝试过的： eng <- tesseract("eng") ECG_signs1 <- tesseract(options = list(tessedit_char_whitelist = "V1V2V3V4V5V6aVRaVLaVF")) ECG_sign

浏览 3提问于2022-10-07得票数 1

1回答

使用Kivy和Screenmanager的OCR问题在屏幕之间传递变量

、、、、

我正在为视障用户构建一个OCR应用程序。我希望应用程序可以直接打开到相机屏幕上，当用户按下按钮拍照时，我希望ocr过程发生，并在lbl或txtbox的文本屏幕上显示输出，并有TTS读出文本所说的内容。我的问题是，我在获取ocr的输出并显示它时遇到了麻烦，我不熟悉screenmanager或python。理想情况下，opencv和tesseract进程将在与捕获相同的功能中发生，但是我无法在下面的屏幕上识别输出。这里有一些代码，任何建议和帮助都很感谢！ # Importing the libraries import cv2 import pytesseract from kivy.app

浏览 60提问于2021-11-08得票数 0

1回答

Tesseract不识别png文件中的captcha，该文件包含英文字母的数字和字母。

、、、

我需要从url中提取captcha，然后用Tesseract来识别它。我的代码是： #!/usr/bin/perl -X ### $user = 'user'; #Enter your username here $pass = 'pass'; #Enter your password here ### #Server settings $home = "http://perltest.adavice.com"; $url = "$home/c/test.cgi?u=$user&p=$pass"; #Get HTML co

浏览 1提问于2018-08-01得票数 0

回答已采纳

2回答

使用java自动旋转扫描文档

、、、

我正在开发一个java应用程序，它使用OCR读取文档。 The output seems to be incorrect sometimes because of the incorrect orientation of the scanned document. So that I need to autorotate the scanned document. May I know whether the OCR Engine itself has the auto-rotation feature or any other SDK has t

浏览 4提问于2013-09-17得票数 4

2回答

使用requests模块访问api

、

curl命令的工作方式与预期一致。但是类似的python代码不需要。 # curl -X POST -H "Content-Type: application/json" -d '{"img_url":"http://tleyden-misc.s3.amazonaws.com/blog_images/ocr_test.pnge","engine":"tesseract"}' http://35.154.148.131:9292/ocr 预期输出： You can create local varia

浏览 1提问于2018-01-08得票数 1

回答已采纳

1回答

如何在python中使用xml: ABBYY的写格式？

、、

我正在使用ABBYY在Python中将文本图像转换为xml。我的目标是保留文本格式，因此我一直试图使用xml:writeFormatting参数，如下所示： ocr_engine = CloudOCR(application_id='', password='') jpg = open('pic16.JPG', 'rb') file = {jpg.name: jpg} result = ocr_engine.process_and_download(file, exportFormat='xml&xml:wri

浏览 4提问于2019-10-29得票数 1

1回答

Tesseract OCR -如何训练这样的图像

、、、

我有一个包含的MVC C#应用程序。我使用的当前版本是v4.1.0-beta1。我正在尝试扫描图像如下所示我的目标是在左边提取玩家的名字和他们上面的数字。我试着让OCR扫描场地/投球区域，但结果太离谱了。因此，我决定将所有玩家的名字和所有数字分开，如下图所示。收视率区域用蓝色标记，球员姓名用红色标记。正如您所看到的，名称和评级始终保持相同的距离。我当前的代码设置如下所示。 public void Get(HttpPostedFileBase file) { using (var engine = new TesseractEngine(Path.Combine

浏览 1提问于2020-03-05得票数 7

1回答

测试如何创建所有文件

、、

我正在测试Emgu.CV的LicensePlateDetector，它与英文车牌很好地兼容。然后我从tesserac-ocr下载PT文件(因为我想使用葡萄牙车牌)，但当我解压缩该文件时，我只有一个简单的文件："por.traineddata“。如果我将这个文件传递给我的命名空间/tessdata，LicensePlateDetector将无法工作。下载文件的位置：如何创建"DangAmbigs“、"freq-dawg”、"inttemp“、"normproto”、"pffmtable“、"unicharset”、“user-

浏览 0提问于2013-11-05得票数 0

1回答

为什么找不到辛可夫的引擎？

、、

我在Ubuntu14.04LTS中运行失败，试图获得更好的DjVU文档的OCR ocrodjvu --in-place document.djvu 但去找ocrodjvu: error: OCR engine (tesseract) was not found。我发现这可能与一些依赖问题有关。在某些情况下，一些用户已经删除了一些python包。不过，我不太清楚。如何在Ubuntu14.04中运行ocrodjvu？

浏览 0提问于2016-01-24得票数 1

回答已采纳

2回答

tesseract未定义符号: pixGenerateHalftoneMask

、、、、

大家好，我刚刚安装了tesseract-ocr。但是当我开始使用它的时候。显示这种错误。我不知道怎么修。请帮帮我。 tesseract test.png test.txt Tesseract Open Source OCR Engine v4.1.1 with Leptonica Warning: Invalid resolution 0 dpi. Using 70 instead. tesseract: symbol lookup error: /usr/local/lib/libtesseract.so.4: undefined symbol: pixGenerateHalftoneM

浏览 27提问于2020-04-28得票数 0

0回答

R中的tesseract包不能识别任何字符

、、、

我使用的是R，版本3.3.2。我正在尝试使用新的tesseract包解析一些文本。图片如下所示：代码很简单： library(tesseract) engine <- tesseract(options = list(tessedit_char_whitelist = "0123456789abcdefghijklmnopqrstuvwxyz")) text <- ocr("some_image_path.png", engine = engine) 结果是： Too few characters. Skipping this page

浏览 11提问于2017-01-11得票数 0

回答已采纳

1回答

使用Tesseract & Opencv程序进行OCR时会遇到一些错误

、、、

当我运行exe时，在tesseract和opencv ocr中遇到一些错误。我如何解决我的问题，当我运行程序，然后显示这个错误，有什么建议吗？这些errors是： D:\OCR\Install-0penCV-with-Tesseract-Windows\OCVTessExample\x64\Debug>OCVTessExample.exe 4.1.0 Error in pixCreateHeader: width must be > 9 Error in pixCreateNoInit: pixd not made Error in pixCreate: pixd not ma

浏览 60提问于2019-12-18得票数 0

回答已采纳

1回答

tesseract-php包装器在本地主机上运行时出现路径错误

、、、、

所以我使用了这里给出的的tesseract-php包装器。下面是我的php代码： <?php require_once "vendor/autoload.php"; use thiagoalessio\TesseractOCR\TesseractOCR; echo (new TesseractOCR('image1.jpeg'))->run(); ?> 在通过cmd运行时，它工作得很好。然而，当我尝试在xampp服务器上运行时，我得到了这个错误 Fatal error: Uncaught thiagoalessio\TesseractOCR\T

浏览 2提问于2018-10-13得票数 0

1回答

OCR多幅图像合并成一个PDF格式

、、

有没有人有经验，如何OCR几个图像，并创建一个输出PDF文件与识别的文本在C#中的Nicomsoft OCR？看起来它可以做到，但是我的C#代码由于某些原因没有生成任何PDF： NSOCRLib.NSOCRClass NsOCR = new NSOCRLib.NSOCRClass(); NsOCR.Engine_InitializeAdvanced(out CfgObj, out OcrObj, out ImgObj); for (i = 0; i < ImageCnt; i++) { NsOCR.Img_LoadFile(ImgObj, ImageFiles[i]); N

浏览 13提问于2015-04-28得票数 1

回答已采纳

1回答

找不到java.awt.image.RenderedImage，无法访问RenderedImage类文件

、

我正在开发一个android应用程序，它有一个OCR模块，在花了一些时间找到API来做这件事后，我从互联网上找到了某个API。我已经下载了他们的jar文件并将其导入(com.asprise.ocr.Ocr)到我的项目中。我的目的是使用这个库从我的SD中的图像中提取信息，并将它们显示在我的android应用程序上，但当我运行该项目时，我得到了以下错误： Error:(137, 35) error: cannot access RenderedImage class file for java.awt.image.RenderedImage not found 从日志中，它向我提供了错误来自我的代

浏览 26提问于2016-09-09得票数 1

1回答

Tesseract-OCR对所有子文件夹中的文件进行批处理，Windows？

、

我试图使用Tesseract-OCR读取和OCR所有的.png文件，不仅在当前文件夹中，(因为有答案)，但在的所有子文件夹。这适用于文件夹： for %%A in ("C:\Users\x\AppData\Local\Tesseract-OCR\temp\*.png") do C:\Users\x\AppData\Local\Tesseract-OCR\tesseract.exe "%%~fA" "%%~dpnxA" 我试着用它遍历"temp“文件夹中的所有子文件夹： (for /r %%a in (*.png) do C:\Users\

浏览 0提问于2019-06-05得票数 1

回答已采纳

2回答

如何解决emgucv中“不能用路径数据和语言英语创建ocr模型”的异常

、、、

当我尝试构建c#项目(路标检测系统的项目)时，它可以构建和调试而不需要额外的资源。但是，当我单击项目主界面中的按钮时，出现了**的异常。 “无法使用路径数据和语言工程创建ocr模型”，突出显示的代码是 public void Init(String dataPath, String language, OcrEngineMode mode) { /*if (!IsEngineModeSupported(mode)) throw new ArgumentException(String.Format("The Ocr eng

浏览 4提问于2012-11-02得票数 0

1回答

将win32 hbitmap转换为winrt软件位图

、

我正在实现OCR功能，需要使用软件位图来调用该函数，如果我有文件路径，创建一个软件位图对象没有问题，但在某些情况下没有物理文件，而且我有可以转换为内存缓冲区的win32 hbitmap，有人可以帮助我将hbitmap或内存缓冲区转换为软件位图以调用OCR函数吗？ std::future<hstring> AsyncSample(const std::wstring &path){ auto file = co_await StorageFile::GetFileFromPathAsync(path); auto stream = co_await file.OpenAs

浏览 2提问于2018-10-23得票数 0

回答已采纳

1回答

遇到问题培训tesseract

我刚接触tesseract，对github页面中的不同目录感到有点困惑。 tesserac-ocr代码库就是我安装的。在/usr/local/share/ tessdata /中安装了tessdata目录因此，现在在训练tesseract时，我运行以下命令- # tesseract img.tif img box.train 我得到以下错误 Tesseract Open Source OCR Engine v3.03 with Leptonica Error opening data file /usr/local/share/tessdata/eng.traineddata Please

浏览 1提问于2015-08-16得票数 3

1回答

尽管我安装了tesseract并将其添加到路径中，但tesseract仍不起作用

、、、、

我已经从这个安装了64位的tesseract。我还将"C:\Program Files\Tesseract-OCR“添加到系统路径。我转到“系统属性”，然后是“高级”选项卡，然后我点击了“环境变量...”。然后，我将"C:\Program Files\Tesseract-OCR“添加到用户变量和系统变量的路径中。在命令提示符下输入"cd C:\Program Files\Tesseract-OCR“，然后输入"tesseract”，得到以下信息： Usage: tesseract --help | --help-extra | --version te

浏览 0提问于2019-10-04得票数 0

2回答

使用tesseract分析屏幕上矩形区域的步骤

、、、

我想使用tesseract OCR获取屏幕矩形区域上的文本，使用Visual C#上的c#。首先，要让tesseract在Visual C#中工作需要什么？我刚开始使用Visual和设置包装器。在谷歌上搜索了几个小时后，我发现我需要：，一个来自官方网站的语言包。我还需要安装windows tesseract-ocr吗？我按照charlesw的GitHu上的步骤在我的项目中设置了包装器。然而，我仍然不知道如何使用这些功能。我想这就是如何声明OCR引擎：TesseractEngine engine = new TesseractEngine(@"./tessdata", &#

浏览 13提问于2014-03-02得票数 1

回答已采纳

4回答

如何删除“带有Leptonica的Tesseract开放源码OCR引擎v3.02”消息

、、、、

当我使用pytesser (用于python的带有tesseract-ocr的图像处理库)并运行： image= Image.open(ImagePath) text = image_to_string(image) print text 因此，我从tesseract获得了text，以及这一行： Tesseract Open Source OCR Engine v3.02 with Leptonica 我认为这一行在运行image_to_string函数时运行。这确实会阻塞控制台中打印的输出。真的很烦人。有人知道怎么摆脱它吗？可能是蟒蛇的台词什么的？

浏览 0提问于2014-07-24得票数 1

回答已采纳

2回答

Tesseract镜像问题

在centos上安装了tesseract之后，我得到了以下错误： Tesseract Open Source OCR Engine v3.05.00dev with Leptonica Error in pixReadMemJpeg: function not present Error in pixReadMem: jpeg: no pix returned Error during processing.

浏览 1提问于2015-11-12得票数 3

2回答

C#可能内存泄漏？

、、

因此，我有一个用C# (vs2010)编写的应用程序，它使用tesseract 3.02DLL和Charles的terreract .net包装器执行OCR。我想我有一个内存泄漏，它似乎在分配Pix对象的代码区域。我正在获取一个PDF，将其转换为灰度PNG，然后将其加载到OCR的Pix对象中。当它起作用的时候，它真的很好用。图像的大小很大(每个昏暗中有5100个像素)，但不是那么大(只有500 K左右)。我的代码：应用程序启动时的Init引擎： private TesseractEngine engine = new TesseractEngine(@"./tessdata/&#

浏览 16提问于2014-03-24得票数 0

回答已采纳

1回答

如何在游戏中发送多部分/相关请求

、、、、

我正在集成我的scala 2.11.6、播放框架2.3.8和open (tesseract)，它需要发送多部分/相关数据。我试着去做，手动生成多部分请求 val postBody = s"""--separator-- |Content-Type: application/json; | | { "engine": "tesseract" } | |--separ

浏览 6提问于2015-08-31得票数 1

回答已采纳

1回答

tesseract (v3.03)输出为PDF

、、

为什么会返回此错误？ root@amd-3700-2gb ~/ocr_test # tesseract -l dan pdf.png out pdf Tesseract Open Source OCR Engine v3.03 with Leptonica Error opening data file /usr/local/share/tessdata/osd.traineddata Please make sure the TESSDATA_PREFIX environment variable is set to the parent directory of your "tes

浏览 2提问于2014-03-02得票数 4

回答已采纳

1回答

Leadtools - OcrException -未启用

、、

我正在使用Leadtools OCR 我引用了以下DLLS： Leadtools.dll Leadtools.Barcode.oneD.dll Leadtools.codecs.dll Leadtools.codecs.fax.dll Leadtools.codecs.png.dll Leadtools.codecs.tif.dll Leadtools.Forms.DocumentWriters.dll Leadtools.forms.ocr.dll Leadtools.forms.ocr.Advantage.dll 和以下代码将Png文件转换为Pdf private void button1

浏览 13提问于2015-05-22得票数 3

2回答

MYSQL --如何为group / order / sum / with添加索引

、、

我正在处理一个包含40K行的mysql表。当前的执行时间大约是2秒，与表indexed.could一起指导我如何更好地优化这个查询和表？以及如何获取“在何处使用；使用临时文件；使用文件”？任何帮助都是非常感谢的。下面的情况. LS_CHG_DTE_OCR LS_CHG_DTE_OCR/RES_STATE_HSE LS_CHG_DTE_OCR/RES_STATE_HSE/RES_CITY_HSE LS_CHG_DTE_OCR/RES_STATE_HSE/RES_CITY_HSE/POSTAL_CDE_HSE 提前感谢 SELECT DATE_FORMAT(`LS_CHG

浏览 7提问于2016-05-10得票数 0

1回答

找不到源-pdf？

、、、、

我想用格拉姆普df将一些pdf文件从图片转换成可读的pdf- 尝试使用以下简单代码：( invoice.pdf当然可以在与python相同的路径上使用，并且应该生成output.pdf ) import ocrmypdf if __name__ == '__main__': fn = r"C:\Users\Polzi\Documents\DEV\Python-Diverses\PDFOCR\invoice.pdf" ocrmypdf.ocr(fn, 'output.pdf', deskew=True) 但不幸的是，我收到了这样的错误消息：

浏览 0提问于2022-01-14得票数 1

回答已采纳

2回答

由于无法找到tesseract，Pytesseract未能加载

、、、

在使用python在windows 10上安装和使用tesseract时，我得到了一个错误： File "C:\ProgramData\Anaconda3\lib\site-packages\pytesseract\pytesseract.py", line 194, in run_tesseract raise TesseractError(status_code, get_errors(error_string)) TesseractError: (1, 'Error opening data file \\Program Files (x86)\\T

浏览 0提问于2019-03-27得票数 0

回答已采纳

1回答

VS 2013年在JS/jQuery中使用Microsoft OCR库

、、、、

我目前正在开发一个Windows8.1应用程序，我使用的是web语言，主要是jQuery (Cordova类型项目)，因为它可能在其他平台上使用。我需要使用Microsoft库(不是Tesseract或任何其他库，我知道，但我现在确实需要使用这个库)，以便在我的应用程序中分析图像和使用提取的文本。我下载了并启动了它:它已经完全正常工作了(当然是在安装了OCR插件之后，在VS 2013中)。我现在正在尝试将OCR引擎集成到我的应用程序中(我也在我的项目中安装了OCR插件)，但它根本不起作用。实际上，当我试图在我的机器上启动我的应用程序时，执行失败并返回以下错误消息： ms-appx://i

浏览 1提问于2015-04-15得票数 37

1回答

符号字符的tesseract ocr命令行

、、

我尝试在这个映像上运行tesseract-ocr，但没有成功： > wget http://i.imgur.com/dOtlrvx.png ... > convert dOtlrvx.png dOtlrvx.tif > tesseract dOtlrvx.tif out -psm 10 && cat out.txt Tesseract Open Source OCR Engine v3.02 with Leptonica Page 0 . 所识别的字符是一个点“。 -psm 10代表“将图像视为单一字符”，因此我认为使用它是正确的选择。我还尝试了其他

浏览 2提问于2014-11-28得票数 1

回答已采纳

1回答

MySql索引和查询优化及最小执行时间

、

目前，我正在处理600 K附近的记录，下面的查询大约需要6.5秒才能获取结果。能帮我把执行时间缩短到2-3秒吗？查询1: SELECT DATE_FORMAT(`LS_CHG_DTE_OCR`, '%Y-%b') AS fmt_date, SUM(connects) AS connects, SUM(disconnects) AS disconnects, ROUND(SUM(REV),0) AS REV FROM ( SELECT LS_CHG_DTE_OCR, IF(`TYPE`='C

浏览 4提问于2016-06-01得票数 2

1回答

尝试执行OCR示例时C#上的异常

、

我正在C#上用CnetSDK尝试OCR应用程序。我有个例外说 “抛出一个异常。--> System.TypeLoadException:无法从程序集'System.Web、Version=4.0.0.0、Culture=neutral加载'System.Web.HttpServerUtility‘类型。” 我尝试了很多类似的东西，但似乎都没有用。有人能告诉我如果他们有什么主意吗？ // Create an OCR Engine instance. OcrEngine OCRLibrary = new OcrEngine();

浏览 0提问于2019-06-12得票数 1

回答已采纳

1回答

选择使用Tesseract OCR提取的部分文本

、、

我正在使用R中最新的Tesseract OCR引擎从几幅图像中提取文本。它运行得很好，我对结果很满意。问题是我不想要整篇文章，只是一些部分，但我不知道如何提取它。代码是： library("tesseract") library("pdftools") library("magick") mypdfFile<-"C:/Users/.../fileName.pdf" mypngFile<-pdf_convert(mypdfFile, format="png", pages=1, dpi=600)

浏览 0提问于2018-11-07得票数 1

1回答

如何构造正确的MultipartEntity，以便在java中发送多部分/相关请求？

、、

我想从本地计算机发送到OCR图像，而不是一些带有图像的远程url (这个例子工作得很好)。但问题是，我不知道如何正确构造多部分实体的有效载荷。我的有效载荷应该如下所示。这就是中所描述的。解码多部分/相关数据中直接给出的图像数据。顺序很重要，第一部分应该是JSON，它告诉它使用哪个OCR引擎。/ocr端点中记录了该JSON的模式。在本例中，JSON的img_url参数将被忽略。图像附件应该是第二部分，它应该与任何图像内容类型(例如，图像/png、图像/jpg等)一起工作。 Request (multipart/related; boundary=---BOUNDARY) --

浏览 2提问于2019-01-16得票数 1

回答已采纳

1回答

在r中的pdf上执行ocr时出错

、、、、

在r中的pdf上尝试OCR，这给了我错误。运行代码后，也会生成"i.txt“文件，但仍然会出现错误。 pdftoppm version 4.00 Copyright 1996-2017 Glyph & Cog, LLC Usage: pdftoppm [options] <PDF-file> <PPM-root> -f <int> : first page to print -l <int> : last page to print -r <number> :

浏览 3提问于2017-09-20得票数 0

2回答

Tesseract安静模式

、

在Ubuntu下，我在3.02版本中使用tesseract-ocr。特别是python的包装器pytesseract，但这个问题也是关于命令行工具的。在下的常见问题解答中写成有一个选项/config-file "quiet“抑制了tesseract的info行。但是，当我使用此选项调用tesseract命令行时，它会显示 "read_params_file:无法安静地打开“ 这是正确的，在相应的config-文件夹中没有"quiet"-config-file。我可以在哪里获得它，或者我如何创建它？我想说的信息行是："Tesseract Open

浏览 2提问于2015-08-04得票数 5

2回答

从网页运行curl http请求

、

我有以下curl命令，它在bash上运行良好 $ curl -d '{"img_url":"http://ec2-54-167-249-150.compute-1.amazonaws.com/IMG_86478_mono.bmp","engine":"tesseract"}' http://ec2-54-226-250-92.compute-1.amazonaws.com:8080/ocr 现在我想通过一个简单的网页运行这个按钮点击。这是我的Javascript function proc

浏览 2提问于2017-04-25得票数 0

回答已采纳

1回答

没有有效的文本识别器:在使用之前初始化OCR引擎，并确保它没有关闭Google vision

、、、

我正在尝试实现谷歌视觉文本识别器，以阅读我的应用程序中的相机图像上的文本。文本识别会工作一段时间，并在每次执行读取文本代码时返回此错误。 E/native: jni_helper.cc:760 No valid text recognizer: initialize the OCR engine before use, and make sure it has not been shut down. D/skia: onFlyCompress E/native: jni_helper.cc:760 No valid text recognizer: initialize the OCR en

浏览 57提问于2020-07-26得票数 0