python ocr 中文 - 腾讯云开发者社区

文章/答案/技术大牛

发布

2回答

开放源码中文OCR

、、、

我到处寻找开放源码的OCR，寻找中文。但如果没有任何运气，似乎很少有一些开放源码的OCR (为中文)是可用的。environment?What's是否有用于制作的开放源码？对于拉丁文和中文实现OCR的主要区别是？我知道一些好的OCR，如Tesseract或Ocropus，如果我想让它支持中文，我该怎么办？如有任何帮助，请提前表示感谢。

浏览 3提问于2009-12-15得票数 9

回答已采纳

1回答

带有文件插入的汉字OCR

我试图OCR一个文件插入到谷歌驱动器。正在插入的图像包含汉字。当OCRing时，图像会像往常一样转换为Google，但是没有一个文本被提取出来。这不会返回错误，但不会发生OCR。根据docs，这个参数只是一个提示，如果OCR引擎能够计算出语言，它就会被覆盖。所以我的问题是：注:在浏览器中上传图像时，OCR语言下拉式包含中文(简体和繁体)

浏览 3提问于2014-07-25得票数 1

2回答

如何修复在Apache Tika for Python中解析的中文PDF以正确读取字符？

、、、

我有一个下载的PDF在中国，我想提取文本从使用提卡+ Python (原始链接到完整的PDF可以找到，或提取的样本页面可以找到)。如果它不识别字体()，它也会出现：然而，在Google Chrome PDF查看器中，整个文本都是的中文。在Adobe Acrobat和Tika + Python中出现乱码时，Google Chrome有什么不同的做法可以读取它，我如何解决这个问题以允许Tika正确解析它？是编码问题还是字体问题？

浏览 1提问于2020-09-07得票数 0

1回答

基于Tesseract OCR的汉字识别

、、、

我一直在使用Tesseract 3.0.2 OCR SDK进行图像文本提取。但是，如果我使用中文文本图像并通过OCR，则Tesseract不会为我提供中文字符，而是我将获得数字和英文字符。但我需要在我使用的图像中显示的中文字符。我如何才能做到这一点？有没有办法获得中文字符而不是其他字符？

浏览 7提问于2013-05-16得票数 16

回答已采纳

1回答

计算机视觉识别文本API无法识别繁体中文

本地容器似乎只支持英语。有人能帮上忙吗？ “重要的是，识别文本容器当前只适用于英语。“https://docs.microsoft.com/en-us/azure/cognitive-services/computer-vision/computer-vision-how-to-install-containers

浏览 32提问于2019-06-20得票数 0

1回答

如何在Tabula Java中指定从哪个目录获取文件

、、

我用python编写了这段代码，我用subprocess模块打开它，然后从那里获取数据，但是我不知道如何从不同的目录中对文件进行OCR。我尝试将完整的文件路径放到代码中文件名应该所在的目录中，但似乎没有起到作用。如何在Tabula中指定从哪个目录获取文件？

浏览 6提问于2017-08-03得票数 0

回答已采纳

1回答

从中文文档中提取数据

、、、、

workfusion是否支持使用OCR和机器学习从中文文档中提取数据。敬请指教。致敬，Sunil Prabakar C

浏览 2提问于2019-09-11得票数 0

1回答

tensorflow读数表

、、

我的目标是在Android手机上实时阅读以下示例：所以我尝试了firebase ML OCR，它工作得很好，它读取完整的值，但是它不读取小数点，也读取了很多周围的文本。另外，如何使用两种模型，一种是提取图像的一部分(黑色和红色边界区域)，然后将它们传递给OCR模型？最后一个数字如何?它总是在两个数字之间(例如:1和2)？

浏览 0提问于2019-02-27得票数 1

回答已采纳

1回答

使用Google Cloud Vision python API的OCR

、、

我使用Google Cloud Vision Python API来执行OCR，以便从文档中提取信息，比如身份证明。有没有一种方法可以裁剪图像，只保留集中文本的部分？

浏览 8提问于2017-06-30得票数 0

1回答

在哪里可以下载Microsoft windows OCR语言包文件？

、

我正在开发一个UWP应用程序，我想使用Windows.Media.Ocr.OcrEngine从图像中提取文本。在我的工作机器上，它只支持英语，我想提取中文单词，我知道我可以通过添加一种新的语言来安装OCR和手写语言包。但似乎我不能把它们下载到我的工作机器上。Add-WindowsCapability -Online -name Language.OCR~~~zh-HK~0.0.1.0Microsoft-Windows-LanguageFeatures-OCR

浏览 7提问于2022-06-30得票数 0

3回答

没有名为'Ocr‘的模块

、、

在做一台OCR。我可以导入asprise_ocr_api，并且我想在这方面工作：Ocr.set_up()ocrEngine.start_engine("eng")OCR_RECOGNIZE_TYPE_ALL, OCR_OUTP

浏览 53提问于2017-07-31得票数 2

回答已采纳

2回答

在mac上安装asprise_ocr_sdk_python_api后，得到"No module named 'ocr'“

、、、

我两个都跑了收到消息 "Requirementalready satisfied: asprise_ocr_sdk_python_api in /Users/myid/miniconda3/envs/competition/lib/p

浏览 6提问于2017-07-21得票数 1

1回答

中文字符在PDFXChange查看器打开的pdf文件的书签中没有正确显示。

、

我安装了PDFXChange查看器，当我在查看器中打开一个pdf文件时，以中文表示的书签(即轮廓)不能正确显示，而是以正方形显示。我怎样才能让它们正确显示？在我重新安装Ubuntu (从14.04到16.04 )和葡萄酒( 1.6到2.0 )之前，书签中的中文字符曾经在查看器中正确显示。Ubuntu和Wine是原因吗？📷

浏览 0提问于2017-09-12得票数 0

1回答

在GRPC服务器中嵌入Python

、、

我有一段python代码，它接受一个image和一个描述该图像中文本的边界框的json文件，并在边界框中returns text。我正在使用python C API来使用我现有的python代码(它使用OCR)来提取文本。如果我在grpc服务器运行之前调用python函数，一切都会正常工作。但是如果我在rpc中调用python函数，那么python函数不会返回任何内容，在执行完部分python代码(我已调试)后，它将变得无响应。我测

浏览 16提问于2020-01-20得票数 0

3回答

日本最精确的开源OCR？

、、

根据您的经验，什么是最准确的开放源码光学字符识别(OCR)库/软件来读取日文文本？日本旧手机(特别是夏普手机)在10年前就有了很好的日本OCR，所以我想它在开源中也是可行的。

浏览 0提问于2015-02-03得票数 6

1回答

Firebase视觉软件包因颤振而停止。

、、、、

到2021年6月18日，只在设备上工作，无法连接到云视觉API，我无法使用OCR 中文文本。我想中文文本。我怎样才能用ML工具包做到这一点？更新:包被更新了，它可以检测到中文文本。

浏览 6提问于2021-06-18得票数 0

2回答

是否使用OCR引擎识别Micr字体？

、、、

我正在使用Microsoft OCR Library来阅读文本。 Microsoft OCR库工作正常。但是，我想阅读链接中给出的以下字符列表。有没有一种方法可以训练OCR库来读取以下字符，或者是否有一种语言可以读取以下字符。

浏览 2提问于2016-08-08得票数 2

1回答

urllib.error.HTTPError: HTTP错误404:仅在Ubuntu的Docker中未找到

、

/python-server/. "."| worker.init_process()easy-ocr | File "/opt

浏览 0提问于2020-12-13得票数 0

1回答

如何仅在pytesser中启用数字？

、、

我正在运行pytesser来进行OCR，这是python中的一个映像。当我第一次从页面上抓取图片时，它很好，但是在接下来的几页中，准确性会下降，直到87+1是$+$为止。奇怪，嗯？我的猜测是，因为pytesser(python从tesseract到python的端口)构建是为了识别单词，并将您的OCR应用到下一个问题的上下文中。所以，没有办法禁用它，我只能将其设置为数字，对吗？或者更好的是，禁用OCR的上下文？

浏览 3提问于2012-02-27得票数 2

1回答

我还能用什么其他诊断方法来解决这个特殊的Perl问题呢？

、

'); $miDoc->OCR(LangId => 'miLANG_ENGLISH'); $miDoc->OCR('miLANG_ENGLISH',1,1)

浏览 6提问于2010-03-02得票数 3

点击加载更多

开放源码中文OCR

带有文件插入的汉字OCR

如何修复在Apache Tika for Python中解析的中文PDF以正确读取字符？

基于Tesseract OCR的汉字识别

计算机视觉识别文本API无法识别繁体中文

如何在Tabula Java中指定从哪个目录获取文件

从中文文档中提取数据

tensorflow读数表

使用Google Cloud Vision python API的OCR

在哪里可以下载Microsoft windows OCR语言包文件？

没有名为'Ocr‘的模块

在mac上安装asprise_ocr_sdk_python_api后，得到"No module named 'ocr'“

中文字符在PDFXChange查看器打开的pdf文件的书签中没有正确显示。

在GRPC服务器中嵌入Python

日本最精确的开源OCR？

Firebase视觉软件包因颤振而停止。

是否使用OCR引擎识别Micr字体？

urllib.error.HTTPError: HTTP错误404:仅在Ubuntu的Docker中未找到

如何仅在pytesser中启用数字？

我还能用什么其他诊断方法来解决这个特殊的Perl问题呢？

热门标签

活动推荐

运营活动

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐