R中的tesseract包不能识别任何字符

R中的tesseract包是一个用于文字识别的开源包，它基于Google的Tesseract OCR引擎。然而，如果tesseract包不能识别任何字符，可能有以下几个可能的原因和解决方法：

缺少语言数据包：Tesseract需要相应的语言数据包才能正确识别文字。你可以通过安装相应的语言数据包来解决这个问题。例如，如果你需要识别英文字符，可以安装"tesseract-ocr-eng"数据包。
图像质量问题：tesseract对图像质量要求较高，如果图像模糊、光线不足或者存在噪声，可能会导致识别失败。你可以尝试对图像进行预处理，如去噪、增强对比度等，以提高识别准确性。
语言设置问题：tesseract默认使用英文识别，如果你需要识别其他语言，需要在识别之前设置语言参数。你可以使用"tesseract_options"函数设置语言参数，例如："eng"表示英文，"chi_sim"表示简体中文。
版本兼容性问题：tesseract包可能与R版本或其他依赖包存在兼容性问题。你可以尝试更新R和tesseract包到最新版本，或者查看相关依赖包的版本要求。

总结起来，如果R中的tesseract包不能识别任何字符，你可以尝试安装相应的语言数据包、优化图像质量、设置正确的语言参数，并确保软件版本兼容性。如果问题仍然存在，你可以查阅tesseract包的官方文档或寻求相关技术支持来解决问题。

腾讯云相关产品和产品介绍链接地址：

腾讯云OCR文字识别：https://cloud.tencent.com/product/ocr
腾讯云图像处理：https://cloud.tencent.com/product/imgpro
腾讯云人工智能：https://cloud.tencent.com/product/ai

页面内容是否对你有帮助？

有帮助

没帮助

R中的tesseract包不能识别任何字符

、、、

我使用的是R，版本3.3.2。我正在尝试使用新的tesseract包解析一些文本。图片如下所示：代码很简单：engine <- tesseract(options = list(tessedit_char_whitelist = "Skipping this page 为什么它不能识别任何字符？

浏览 11提问于2017-01-11得票数 0

回答已采纳

1回答

使用R中的tesseract识别图像中的特定字符？

、、、、

我试图识别和删除心电图图像文件中的特定字符。在ECG中，出现的“单词”不是通常的英语单词，而是像"aVR“、"V5”、"II“这样的引号。下面是一个示例图像：我试图使用R中的tesseract包来识别和删除这些图像中的所有字符/数字，以便只留

浏览 3提问于2022-10-07得票数 1

2回答

Tesseract伪空间识别

、、、、

我用tesseract来识别序列号。这是可以接受的，常见的问题，如零和"O"，6和5的错误识别，或者M和H的存在。此外，通过这个tesseract添加空格到可识别的词，其中没有空格在图像中。以下图像被识别为"HI 3H"。此图像产生“FBKHJ1R1”所以tesseract添加了一个空格，尽管图像<e

浏览 9提问于2015-06-26得票数 8

1回答

tesseract ocr不适用于androidx.camera

、、、、

我使用androidx.camera包构建了一个带有照相机视图的andoid应用程序。因此，该应用程序显示相机流，用按钮拍照，用tesseract读取图片文本。问题是，tesseract不能识别图像的文本(它只返回没有意义的字符)，但是，如果我使用普通的相机照片意图拍摄同一张照片，tesseract就能完美地工作并识别文本。所以，如果有人知道问题出在哪里，我很感激你的</e

浏览 8提问于2022-07-01得票数 0

1回答

如何将tesseract配置更改为识别§并在R中应用pdftools::pdf_ocr_text？

、、、

我在R中使用pdftools从扫描和基于文本的PDF文件中提取文本。一个问题是§字符。这是不能被识别的。这并没有改变任何事情，我仍然无法提取§。它们仍然以8的形式出现。我绝不是OCR和tesseract方面的专家，在文档方面有改进的余地。当我从参数列表中删除§时，下面的工作可以识别l

浏览 10提问于2020-12-01得票数 2

回答已采纳

1回答

OpenCV tesseract未检测到图像中单个数字

、、

我正在对python使用tesseract。它能识别几乎所有包含2个或2个以上数字或字符的图像我不想用“只有数字”来训练tesseract，因为我也在识别字符。但是附加的图像不能从tessearact中识别

浏览 33提问于2020-06-01得票数 0

4回答

改进图片以检测区域内的字符

、、、

我的目标是检测这类图像上的字符。我需要对图像进行改进，以便Tesseract能够更好地识别，可能需要执行以下步骤：旋转图像，以便蓝色矩形是水平的，在这方面需要帮助。= r'C:/Program (x86)/Tesseract-OCR/tesseract.exe‘tessdata_dir_config = r'--tessdata-dir "C:

浏览 0提问于2018-09-24得票数 3

回答已采纳

2回答

我正在按照教程为Android编译Tesseract的分支(一个光学字符识别包)。我正在使用Cygwin为Tesseract Android项目构建NDK。在调用ndk-build (从tess-two目录)时，我得到了以下错误： c:/android-ndk-r8b-windows/android-ndk-r8b/toolchains/arm-linux-androideabi/obj/lo

浏览 3提问于2012-09-18得票数 3

回答已采纳

1回答

如何从代码中检查Tesseract* API中是否安装了某种语言？*

、

我对Tesseract API有个问题。我想从C++代码中检查哪些语言可以用来执行光学字符识别。我想告诉用户，一些语言包没有安装。要启用某些语言，需要安装tesseract-lang-xxx包。最后，如果我可以在CMake中检查它，它将是正常的。

浏览 21提问于2019-02-22得票数 0

4回答

tesseract不能识别一个数字图像

我正在对python使用tesseract。它几乎可以识别我的所有带有2个或更多数字或字符的图像。但是tesseract不能识别只有一个数字的图像。我尝试使用命令行，但得到的响应是“空页面”。我不想用“只有数字”来训练tesseract，因为我也在识别字符。在未被tesseract识别的图像下面。

浏览 33提问于2018-03-27得票数 5

1回答

使用Tess4J无法100%准确地识别jpg文件中的文本

、

我想要将一个.flv视频文件分割成分辨率良好的.jpg/png帧，然后使用Tess4J工具(Tesseract的JNA包装器)识别其中的字符序列。：水平分辨率:96dpi位深度: 24 我的问题是:我尝试使用Tess4J使用以下代码片段来识别视频帧(我拆分的jpg图像文件)中的字符，它正在识别

浏览 16提问于2013-02-19得票数 1

1回答

Tesseract OCR iOS检测手写表单中的文本，并使用该文本自动填充联机表单

、、、、

我已经使用Tesseract从扫描的文档中提取文本，并且我能够从扫描的文档中提取文本。现在，我想从手写表单(硬拷贝)中提取文本，并使用该文本自动填充我的在线表单(同一手写表单的软拷贝)。提前感谢你的帮助。

浏览 1提问于2017-06-27得票数 2

1回答

JTessBoxEditor没有识别字符和制作盒子

、、

我试图通过在图像中制作方框字符来训练我的测试血清，但JTessBoxEditor无法识别任何字符。当运行命令--> tesseract eng.arial.exp1.tiff eng.arial.exp1 batch.nochop makebox-->它在同一个.tiff图像上创建一个盒子文件，但我不知道如何编辑文本文件有没有什么原因JTessBoxEditor不能识别任何字符？有没有其

浏览 5提问于2019-10-15得票数 0

6回答

如何自定义Tesseract忽略噪声？

、、、、

我有一个这样的图像(白色背景和黑色文本)。如果没有噪声(如你所见:数字行的顶部和底部有许多噪声)，Tesseract可以很好地识别数字。但当有噪声时，Tesseract会尝试将其识别为数字，并将更多数字添加到结果中。这真的很糟糕。如何让Tesseract忽略噪声？我不能对图像进行预处理，使其具有更强的对比度或更清晰的文本。这对任何事情都没有帮助。如果某些工具只能突出显示字

浏览 0提问于2013-04-07得票数 5

2回答

SDK环境下的Android名片扫描库

、

有没有名片扫描器的库?我是android新手。帮帮我。提前谢谢。

浏览 5提问于2014-03-07得票数 7

1回答

使cmd / powershell / windows使用单独的tesseract安装，而不是chocolatey提供的安装。

、、、、

几年前，我用巧克力安装了tesseract，然后就把它忘了。现在我遇到了一个问题，当我在cmd中输入tesseract命令时，它会使用这个tesseract，而不是我单独安装的新的tesseract。与巧克力一起安装的那个的问题是它已经过时了，我无法更新或卸载它。如何让windows / cmd / powershell使用单独的tesseract安装而不是chocolatey？

浏览 71提问于2021-10-17得票数 1

回答已采纳

1回答

Tesseract无法识别一系列随机的英语字符。

、

我正在寻找一些帮助来配置Tesseract来识别以下图像(称为token.png)中的字符：使用默认设置运行Tesseract结果：在上，建议禁用字典 load_system_dawg F然后跑 <em

浏览 0提问于2019-07-25得票数 0

1回答

如何从Tesseract库中获得更好的结果？

、

我是OCR库的新手，我使用了这个应用程序来测试Google的Tesseract库：我在哪里可以学习使用Tesseract库并制作更好的应用程序？Google Goggles使用的是什么库？

浏览 1提问于2014-12-21得票数 1

2回答

tesseract虚假置信决策

、、

我正在使用tesseract来识别序列号。在tesseract，有可能在不同的层次上识别文本，比如识别单个单词、行、段落、字符。也有可能获得这些水平的每个方面的信心。因此，我查看了我的序列号中每个字符的可信度，并注意到tesseract通常返回的是最好的选择，而不是最自信的字符。有人也经历过这

浏览 3提问于2015-06-27得票数 2

1回答

如何使用java忽略Tesseract* OCR中的特殊字符*

、、、

我使用java通过Tesseract OCR从图像中提取文本。但是输出是由一些特殊的字符组成的，因为图像包含了一些符号。我想忽略所有的特殊字符，只显示文本。有什么办法我能做到吗？

浏览 0提问于2018-02-09得票数 0

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

R中的tesseract包不能识别任何字符

相关·内容

R中的tesseract包不能识别任何字符

使用R中的tesseract识别图像中的特定字符？

Tesseract伪空间识别

tesseract ocr不适用于androidx.camera

如何将tesseract配置更改为识别§并在R中应用pdftools::pdf_ocr_text？

OpenCV tesseract未检测到图像中单个数字

改进图片以检测区域内的字符

使用Android NDK构建Tesseract

如何从代码中检查Tesseract* API中是否安装了某种语言？*

tesseract不能识别一个数字图像

使用Tess4J无法100%准确地识别jpg文件中的文本

Tesseract OCR iOS检测手写表单中的文本，并使用该文本自动填充联机表单

JTessBoxEditor没有识别字符和制作盒子

如何自定义Tesseract忽略噪声？

SDK环境下的Android名片扫描库

使cmd / powershell / windows使用单独的tesseract安装，而不是chocolatey提供的安装。

Tesseract无法识别一系列随机的英语字符。

如何从Tesseract库中获得更好的结果？

tesseract虚假置信决策

如何使用java忽略Tesseract* OCR中的特殊字符*

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐