ocr识别引擎_ocr文字识别引擎_ocr识别的引擎 - 腾讯云开发者社区

、、、

我希望在我制作的一款软件中使用手写识别和OCR。我想知道是否有人知道任何(最新的)支持OCR或手写识别的软件包。我正在寻找更多的免费套餐，但我也会对商业套餐感兴趣。我看过其他一些文章，比如09年的，但我找不到任何看起来合理的文章。我最好用C#编写代码，并使用Windows7内置的笔迹分析器？

浏览 2提问于2012-08-09得票数 1

回答已采纳

3回答

在此基础上对图像进行分析和变换，以获得更好的OCR结果

、

我有一个OCR项目，但它只适用于图像，其中的文字是相当直，而不是倒置。(不是旋转文本)，所以我想让OCR能够识别任何类型的图像，即使是颠倒的。但我不知道解决这个问题的方法是什么。我需要一些东西，比如分析字母行，但即使这样，我也不能识别行是否颠倒。

浏览 6提问于2010-02-19得票数 2

回答已采纳

2回答

Windows ocr能识别自定义符号/字体吗？

、、、、

我正在为UWP开发，Windows有一个OCR引擎: Windows.Media.Ocr 我的问题是:有人知道Windows OCR是否可以接受识别新字符或使用自定义字体的培训？如果是的话，我怎么能做到？我想要实现的是识别非字母符号。我想在每个例子中识别字符⌰(unicode: U+2316)或⌖(U+2316)。我想识别的字符不是任何语言的符号。

浏览 9提问于2016-03-07得票数 3

回答已采纳

2回答

如何在java中使用OCR从表单的不同字段中识别表单数据？

、、、、

我有一个图像的形式，其中包含不同的领域，如姓名，编号，地址等。我想从这些领域识别数据，并保存到数据库中。现在，我的OCR工作正常，但我不知道如何从图像中提取特定的字段数据(名称、地址)以用于OCR。简单地说，我想知道如何识别输出文件中的字符，这些字符来自姓名字段、地址字段或任何其他字段。

浏览 12提问于2012-11-21得票数 1

1回答

腾讯云文字识别和腾讯优图文字识别？

请问腾讯云官网的文字识别和腾讯优图网站上的OCR文字识别有什么区别啊，这两个接口调用的好像不一样？

浏览 638提问于2020-03-30

3回答

在iphone中实现tesseract OCR

、、、、

我想在我的项目中实现手写识别。例如，当用户在屏幕上写入A时，屏幕应该显示A，我在google上搜索过，到目前为止我已经找到了，tesseract OCR，但是我不知道tesseract OCR是什么，以及如何在我的项目中实现这一点，可以有人给出tesseract OCR的演示教程，我不知道tesseract OCR是免费的还是付费的. tesseract OCR ！！！

浏览 5提问于2012-02-03得票数 3

回答已采纳

3回答

已知字体的OCR

、

我正在寻找一个可以用字体参数化的OCR库，因为我一直都知道它，而且我相信这样的识别结果会更好。有人知道吗？

浏览 1提问于2010-09-03得票数 13

1回答

OCR符号与非符号检测/识别

、、

在OCR应用程序中，您通常会找到图像的连接组件，并在这些组件上运行OCR引擎以识别它们。我的问题是，如果您连接的组件具有训练集中不存在的符号/形状，应该怎么办。例如，如果我们正在运行数字识别，而图像有一条直线或一个字符，那么就说"X“或任何不是数字的东西。你怎么知道它不是一个数字呢？

浏览 1提问于2011-02-06得票数 0

1回答

我正在寻找布局分析库或工具(最好是开源的)，可以应用于文本PDF，以识别主要文本内容与侧栏，章节标题，章节标题(甚至可能是具有装饰/阴影和下划线的花哨的标题)等。我遇到了像OCRopus这样的工具，它们使用光学字符识别和图像识别来识别布局。有没有库可以在没有OCR的情况下做同样的事情？可以从文本PDF中提取文本和图像，并将包含文本和图像位置的输入提供给该工具；对于此类文件使用OCR将是相当繁琐的。

浏览 2提问于2013-05-08得票数 2

回答已采纳

1回答

光学字符识别

、、、

我只是怀疑搜索引擎的结果还不清楚。OCR (光学字符识别)能读取captcha，QR-代码和条形码吗？卡普查。 QR-密码条形码。牌照代码

浏览 2提问于2014-03-19得票数 0

回答已采纳

3回答

光学字符识别和人工神经网络有什么关系？

、、

我看到不同的文章谈到OCR表单识别(数据提取)，他们说他们使用神经网络进行表单识别，那么人工神经网络(ANN)和表单识别之间的关系是什么？如果我想从BusinessCard中提取字段，需要使用ANN还是可选的？换句话说，我什么时候需要使用ANN，什么时候不需要？

浏览 6提问于2012-04-05得票数 1

回答已采纳

2回答

Google Books如何找到文本区域？

、

计算机视觉中一个具有挑战性的主题是处理文档扫描。通常，这涉及许多步骤，如噪声去除、颜色分析、二值化、文本块识别、OCR，然后可能还会进行一些上下文分析和校正。我很好奇，有没有人能理解，知道或者能告诉我Google在OCR阶段之前是如何识别文本块的。有什么见解吗？

浏览 2提问于2009-01-15得票数 4

1回答

提高扫描文档的OCR精度

、、、

我正在使用标准的兄弟A3多功能扫描许多A3文档，然后使用FineReader Pro对图像进行OCR‘。然而，我得到了很多错误的字符识别，和许多非字母数字奇怪的字符。有人能给我任何建议，以编程方式提高OCR的准确性，要么对扫描图像进行预处理，要么对识别的文本进行后处理？编辑：.它包括一些样本图像，从中我得到了最糟糕的结果。

浏览 3提问于2011-01-11得票数 1

回答已采纳

5回答

用于识别.NET中手写笔迹的光学字符识别系统

、、

我需要在.NET应用程序中使用可以识别手写的OCR组件。我们从MS office启动并运行了MODI组件，它可以识别打印的文本，但不能识别手写内容。我不介意付钱。有人有什么建议吗？非常感谢，吉姆

浏览 7提问于2009-02-26得票数 12

5回答

是否有OCR无法识别的字体？

我正在试着写一个只能被人读懂的文档。无法复制文档内容。为此，我将其页面转换为图片，并将其添加回PDF文件。主要的问题是，任何OCR程序都可以恢复整个书面文本，特别是页面将是清晰的(而不是扫描的书)，这将提高OCR的准确性。那么，有没有OCR无法识别的字体呢？否则，有没有一种技术可以让我的文档只被人类阅读，而不被OCR识别？(例如，添加特定的背景，等等) 提前谢谢你。

浏览 3提问于2012-11-13得票数 4

回答已采纳

2回答

在google的tesseract-OCR识别中使用了哪种算法？

、、

在google的tesseract中使用哪种算法--OCR进行识别?是神经网络吗？

浏览 7提问于2017-06-07得票数 5

1回答

使用OCR识别“文本大小”和“文本字体”

、、

我必须从图像中识别文本，这是可能的，因为有很多的OCR库，但现在我必须找到文本大小和字体类型。我已经搜索了很多，但没有得到帮助，这是可能的，有一个应用程序"WhatTheFont“可以在商店找到的字体类型，是最好的匹配。怎么做？

浏览 3提问于2017-01-05得票数 3

1回答

iOS的手写识别应用程序如何识别我的笔迹？

、、、

可能重复：我正在为iPad构建一个可以识别手写的应用程序，我在想，是否有库/框架可以这样做呢？有人知道其他应用程序是如何做到的吗？他们是否使用OCR或手势识别？我知道这里有很多关于这个问题的问题，但我没有找到令人满意的答案。谢谢。

浏览 4提问于2011-10-30得票数 2

回答已采纳

1回答

使用Tesseract读取电话号码的OCR

、、

我正在努力完成一个项目，其中必须包括一些OCR。对于工作，我选择了Tesseract OCR，但结果并不是最优的。我曾尝试将字符集限制为1234567890-，但结果并不理想。有没有一个最佳的图像大小，我可以使用或某种方法来训练Tesseract，以更好地识别这种字符串？图片是这样的：而tesseract返回的结果是05175150152，这是不正确的，而且它应该更好，因为图像没有以任何方式修改。我通过PHP和exec使用tesseract，命令如下： "C:\Program Files\Tesseract-OCR\tesseract.exe" C:\wamp\www

浏览 0提问于2012-05-02得票数 1

1回答

openCV - anpr系统。提高成功率

、、

我正在尝试写一个非常好的ANPR (自动车牌识别)系统为巴西的汽车牌照。到目前为止，我已经使用了javaANPR方法，即X和Y投影来找到感兴趣区域(车牌)。它工作得很好，但对车内有很多阴影的图像效果不是很好。我也在使用tesseract-ocr进行字符识别。我获得了80%的成功是因为非常好的汽车图像，因为汽车不动。而我得到的不到60%，因为移动的汽车图像不是很好。我一直在网上寻找资源，阅读论文等。你认为什么可以帮助我改进它？也许可以使用两种方法？也使用templateMatch吗？因为我需要95% - 98%的成功率。我在网上看到了他们的演示：他们真的做得很好。它对我所有的图像都有效

浏览 0提问于2013-11-23得票数 0

1回答

Kofax捕获识别-I与1

、、

使用Kofax Capture 10 (SP1，FP2)，我在文档的某些字段上设置了识别区。这些字段始终将I识别为1。我尝试了所有我能想到的不会清除字段中所有字符的设置组合，但都无济于事。我已经尝试了高级OCR和高性能OCR，不同的字符过滤器。各种各样的东西。我可以尝试哪些选项来自动识别此字符？我应该告诉制作表单的人(它们是由计算机生成的)他们需要尝试使用不同的字体吗？让他们相信现在是时候考虑使用验证了吗？我当前的字段设置： Kofax高级OCR，除了在高级对话框中最大限度地提高精确度外，没有自定义设置。到目前为止，这个方法和我尝试过的其他方法一样有效。使用的字体是8- 12磅，顺便说一

浏览 2提问于2012-12-13得票数 3

回答已采纳

2回答

Tessaract OCR是否使用神经网络作为它们的默认训练机制？

、、、

抱歉，这可能是个愚蠢的问题。但我对机器学习和Tessaract OCR相当陌生。我听说Tessaract OCR是可以训练的。我需要知道的是，Tessaract OCR是使用神经网络作为它们的默认训练机制，还是我们必须明确地编程才能使用神经网络？如果我对这个“训练”概念想错了，很抱歉。但我需要确切知道的是，Tessaract已经使用了NN，如果不是，我如何使用NN和tessaract OCR来提高识别精度？如果有人能建议我一些好的资源/方法来参考/尝试和开始，这也是一个很大的帮助。我目前所知道的基本机器学习，监督训练的概念，并执行基本的图像OCR操作在Tessaract OCR。

浏览 3提问于2015-04-10得票数 12

回答已采纳

3回答

OCR是如何工作的？以及如何将OCR添加到字母表

、、

我有一个以前没有处理过的字母表，所以当扫描时，没有办法用OCR来检测要识别的字母。我正在尝试为它编写OCR程序，但在这方面没有太多经验。对于从哪里开始，以及这样的系统通常是如何实现的，我希望能得到一些提示。

浏览 0提问于2012-02-24得票数 3

1回答

为什么Tesseract不能认出我的形象？

请参阅图片：我认为我的图像很简单，但是tesseract ocr不能识别它:(它显示“A§§§SX”，而不是A9FCCC 请告诉我为什么？怎么才能认出它呢？谢谢

浏览 3提问于2013-06-17得票数 0

1回答

Computer Vision API v1.0和v2.0有什么区别？

两者都有自己的文档，我看到它们之间只有很小的措辞差异。是否有实际发生变化的列表？例如，OCR是否在2.0版的基础上有所改进，或者除了手写识别之外，它是一样的？某种类型的changelog真的会有所不同。

浏览 15提问于2018-08-06得票数 0

回答已采纳

4回答

OCR纠错:如何合并三个错误结果以减少错误

、、

问题所在我试图通过合并来自三种不同OCR系统(tesseract、楔形信息、ocrad)的输出来改进OCR过程的结果。我已经做了图像预处理(干洗，鄙视，三和更多)。我不认为这部分可以改进得更多。通常需要识别的文本长度在1到6个字之间。文本的语言是未知的，它们经常包含幻想词。我在Linux上。首选语言是Python。到目前为止我拥有的通常每个结果都有一个或两个错误。但它们在不同的字符/位置上有错误。错误可能是它们识别错误的字符，或者它们包含一个不存在的字符。他们不常忽视一个角色。一个示例看起来可能如下所示： Xorem_ipsum lorXYm_ipsum lorem_ipuX X是错误

浏览 3提问于2010-09-10得票数 6

1回答

使用Apt get for Google App Engine安装包

、、、、

我正在部署一个光学字符识别web应用程序。然而，我意识到其中一个包需要通过apt-get而不是pip来安装。我想知道我该如何通过谷歌应用引擎来做这件事？仅供参考，我想安装： sudo apt-get install tesseract-ocr

浏览 15提问于2020-05-07得票数 0

回答已采纳

1回答

Tesseract OCR iOS图像格式

、、、

我已经使用Tesseract OCR iOS扫描文本，我已经让它与项目中包含的一张照片一起工作。但是，当从UIImage传递UIImagePickerController时，它不起作用。我设置了这个简单的测试：从选择器获取原始图像，并将其提供给tesseract：不工作吗？将UIImage保存为JPEG，从应用程序容器中复制它，将其包含在项目中，并将其提供给tesseract：不工作吗？在photoshop中打开保存的UIImage，并再次保存它(不更改默认的JPEG质量12设置)。将它包含在将它提供给tesseract的项目中：Works?!? Tesseract

浏览 2提问于2015-12-18得票数 5

回答已采纳

1回答

对于CS最后一年的项目，有什么有趣的OCR/NLP相关项目吗？

、

我是一名大四的CS学生，对OCR和NLP的东西非常感兴趣。问题是我对OCR还一无所知，而且我的项目持续时间只有5个月。我想知道OCR和NLP的东西，是可行的我的项目？对于我的项目来说，为一种语言编写一个(简单的) OCR引擎太难了吗？如何为现有的FOSS OCR软件添加语言支持？

浏览 2提问于2010-10-21得票数 0

1回答

OCR识别- gocr

我在尝试使用gocr工具进行ocr时遇到了一个小问题。它有时会将o识别为零，反之亦然。为了解决这个问题，我尝试让它使用用户指定的数据库路径。但这样做需要我为所有可能的角色创建一个映射。有没有办法告诉gocr只对这两个字符使用手动db？？谢谢

浏览 0提问于2010-08-12得票数 0

1回答

如何在Tesseract中设置配置变量以更好地识别代码？

我想用Tesseract来识别代码。他们的网站上说，我可以通过将配置变量load_system_dawg和load_freq_dawg设置为false来禁用字典。然而，我一直未能正确地做到这一点。 $ tesseract img.jpg output.txt --oem 0 -c load_system_dawg=0 load_freq_dawg=0 read_params_file: Can't open load_freq_dawg=0 Error: Tesseract (legacy) engine requested, but components are not prese

浏览 22提问于2022-06-08得票数 0

1回答

Vim运行所有以相同名称开头的文件类型插件

、

刚刚发现，vim运行所有以相同名称开头的ftplugin。例如：检测到的文件类型= ocr 这些文件具有不同的版本。因此我有不同的ftplugins： ocr_01 =>基础版(检查文件版本并设置正确的文件类型)ocr_01 =>版本01...ocr_n =>版本n 当打开一个光学字符识别文件，文件类型被检测为‘光学字符识别’->的光学字符识别基础-File插件将加载。它检查文件的版本(例如01) =>文件类型将被设置为ocr_01。我期望，只有文件类型插件ocr_01加载，但所有以'ocr‘开头的ftplugin是: ocr_01，ocr_02..

浏览 8提问于2013-07-26得票数 0

1回答

card.io图像处理是如何工作的？

、、、、

像这样的服务是如何在幕后工作的？他们是使用像Tesseract这样的OCR库，还是更复杂？另外，在这个中，它看起来像是在等待你把你的卡拿在一个特定的范围内，从相机内的绿色边界相机，当你这样做，它会自动拍照。如果图像识别发生在服务器上，他们是如何做到的？如何实现我自己的移动2D对象扫描仪？我从哪里开始？

浏览 1提问于2013-11-26得票数 7

回答已采纳

1回答

查找表单和文档的OCR SDK

、、

我公司想用java开发一个基于OCR技术的文档管理项目。有OCR开发经验的人可以推荐哪种OCR SDK更好？

浏览 1提问于2010-11-02得票数 5

2回答

识别图像中的视觉形状

、、、

交付SCADA解决方案时，我们通常会得到结构化控制图(如下面所示的流程图)中指定的最终用户规范，这些规范通常以PDF格式或图像形式提交。为了在C#中访问这些库，我希望使用一个OpenCV库。我在看模板识别，但似乎不适合开始输入机器学习算法来教它识别预先知道的特定形状的盒子和箭头。我看过的库有一些polyedge函数。但是，从下面的例子可以看出，当元素之间没有间隔时，系统会把整个事情看作一个大多边形。注释可能是任意90度旋转，我想识别它们以及使用OCR的矩形的内容。我在这方面没有任何经验，这一点现在应该是显而易见的，所以我希望有人能指出我在合适的兔子洞的方向。如果有多种方法，那么选择数

浏览 1提问于2014-09-05得票数 4

回答已采纳

3回答

使用OCR从图像文件中读取文本的API

、

我正在寻找Java中的OCR (光学字符识别)的示例代码或API名称，使用它我可以从图像文件中提取所有文本。没有比较它与任何图像，我正在做使用下面的代码。 public class OCRTest { static String STR = ""; public static void main(String[] args) { OCR l = new OCR(0.70f); l.loadFontsDirectory(OCRTest.class, new File("fonts")); l.lo

浏览 0提问于2014-03-20得票数 9

0回答

调用OCR营业执照识别报内部错误？

、

调用调用OCR营业执照识别报“内部错误”这种不明不白的提示，相同的header，相同的multipart/form-data 方式，调用“OCR-通用印刷体识别”确能识别成功，证明程序的加密方式，图片的base64没有问题！OCR营业执照识别确报“内部错误”看不明白什么意思。

浏览 282提问于2019-07-10

2回答

尽管输入了确切的语句，AWS Lex仍然匹配错误的意图。

、、、

我在很多不同的情况下都有这个问题。我将分享一个例子。我有一些常见问题的意图。一个答案是“什么是命名实体识别”--这是它的话语：告诉我关于命名实体的识别告诉我关于纳的事什么是纳你所说的命名实体识别是什么意思？什么是命名实体识别另一个回答是“什么是光学字符识别？”这是它的话语： OCR 你说OCR是什么意思？你能告诉我什么是OCR吗？讲述OCR 什么是光学字符识别？什么是OCR？当我进入时，“ocr是什么？”它按照预期工作，并给出了OCR的答案。但是当我在所有大写中输入OCR时，都会问同样的问题(OCR是什么？)它

浏览 4提问于2019-03-22得票数 2

回答已采纳

1回答

复杂文档的OCR扫描

、、、

我需要创建一个工具，将使用高质量的相机，以扫描特定的文本块从文件和OCR他们。每个文档都匹配相同的模板，其中包含几个填充了数据的表。我需要从每个扫描文档中提取一个特定单元的数据。我需要考虑旋转和轻微的图像转换。整个工作流应该如下所示：文档被“显示”给摄像机。软件制作文件的图片。软件占了一些小的旋转和其他转换(小剪切，缩放，旋转可能发生，因为文档是掌握在手中)。软件识别正确的模板文档正在显示，并从特定的单元格中提取图像。然后图像是OCR。基本上，我不需要一个最终的解决方案，而是一些方向，从哪里开始寻找。我知道如何对纯文本执行OCRing，我不知道的是如何实现步

浏览 3提问于2012-04-08得票数 1

回答已采纳

2回答

OCR扫描文件并检索元数据

、、、、

我正在使用Alfresco社区6.1。我有数千张发票要扫描，OCR它们(接近100%的识别)和检索所需的元数据(合作伙伴，发票号码，金额，单位，货币，.)。根据检索到的这些元数据，我需要对发票进行一些操作(将它们移动到适当的文件夹，应用一些工作流.)。作为第一批批准：对于OCR，我使用了，但结果并不十分准确(远远不是100%)。为了检索结果，我将OCRed转换成一个纯文本文件，然后使用javascript和document.content搜索它的内容。但是由于OCR不准确，我无法判断它是否是在文档中搜索的最佳解决方案。所以我的问题是：如何使OCR结果更加准确？

浏览 4提问于2019-09-26得票数 1

2回答

Tesseract: RetriveResultDetail-方法总是返回null

、、、

我想用.Net中的Tesseract OCR引擎做一个光学字符识别。因此，我使用了tesseractdotnet-Wrapper 。我需要获取每个识别单词的单词位置(RetriveResultDetail-Method)： TesseractProcessor ocr = new TesseractProcessor(); ocr.Init(executionPath, "eng", 3); Image image = Image.FromFile(imagePath); Console.WriteLine(ocr.Apply(image)); List<tesserac

浏览 0提问于2013-06-03得票数 0

回答已采纳

3回答

如何提高OCR识别能力？

、、、

正如你在图片中看到的，我在正确识别这类单词时遇到了困难在结果中我得到了这个： RMACWI O 12X60 VPFZZOOIK IADA50527 PORTES 我正在使用这些变量 ocr.SetVariable("tessedit_pageseg_mode", 10); ocr.SetVariable("tessedit_char_whitelist", "abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ0123456789/-,.€"); 有没有提高认知度的方法？后来我对

浏览 0提问于2019-11-28得票数 3

5回答

在iPhone上实时识别数字是可能的吗？

、、、

我需要实时识别iPhone上摄像头图像中的数字。我知道图像上的位数不会超过5位。考虑到iPhone的计算规范，这个问题解决起来现实吗？有没有人有使用Tesseract OCR库的经验，你认为使用它可以解决这个问题吗？

浏览 2提问于2011-02-03得票数 9

3回答

OCR的JavaScript库

、、、

我的产品经理刚刚要求我在OCR文本识别操作中使用我一直在开发的混合应用程序。我一直在研究、奥格勒和其他一些替代方案，但它们看起来是如此的不一致。对于OCR有什么更好的选择吗？我用它来刮名片上的文字。当字体、颜色等不一样时，我知道这会带来一些问题。我所面临的不一致是因为这一点。我一直在测试一些本地的安卓应用程序，比如snapBizCard，在测试时，它们似乎都做得很好。但我需要使用JavaScript库。

浏览 0提问于2016-06-10得票数 1

4回答

如何在Tesseract和OpenCV之间进行选择？

、、、、

我最近遇到了和。看起来Tesseract是一个成熟的光学字符识别引擎，OpenCV可以作为一个框架来创建光学字符识别应用程序/服务。我试着在我的一些图像上使用Tesseract，它的准确性似乎还不错。后来，我发现了一个非常简单的关于使用OpenCV通过Python执行OCR的，这给我留下了深刻的印象。在几分钟内，我完成了系统的训练，它的准确性很好。当然，采用这种方法意味着我需要使用大量的训练集来广泛地训练我的系统。我的具体问题如下：如何在Tesseract和使用OpenCV构建自定义光学字符识别应用程序之间进行选择？有针对不同语言的Tesseract的训练数据集。OpenCV有没有类似的

浏览 152提问于2012-07-15得票数 96

回答已采纳

1回答

是否能够识别使用Tesseract OCR绘制在iPhone屏幕上的字符？

、、、

从过去的两周开始，我正在努力实现“识别iPhone屏幕上的字符”。我搜索了这个，找到了Tesseract OCR。通过使用Tesseract OCR，我们可以从图片中识别字符。现在我的问题是，是否能够识别使用Tesseract OCR绘制在iPhone屏幕上的字符？如果可能的话，给我一些初步的步骤来完成这个任务。

浏览 2提问于2013-12-19得票数 6

回答已采纳

1回答

用模糊文本改进Tesseract OCR结果

、、、

我正在致力于印刷文本的OCR识别。特别是，我着重于预处理步骤，以改进引擎的结果。通过自适应阈值处理、噪声去除、文本分割等，取得了良好的效果。但是，当其他商业产品获得不错的结果时，Tesseract似乎还是失败了。我使用了下面的测试映像，下面是与两个商业OCR相比，Tesseract 3.04获得的结果。所有3项服务都提供了相同的二值图像，其中包含了一些稍微模糊的文本。 Tesseract Careers in Technology Consulting Networking Lunch 21 m 2014, 11:00 - 14:30 Definingthecorporatel

浏览 3提问于2014-12-27得票数 16

1回答

一种用于模因图像的OCR字体

、

我正在为网络模因图像编码一个特殊的光学字符识别。这是一个学校项目，应该用C语言编码。目前，我在编写OCR代码的方法/算法上遇到了问题。事实上，几乎所有的模因图像都有相同的字体，这是影响(更不用说其他没有影响字体)。OCR的目标将是检测和识别字符，这些字符在影响字体，在模因图像的前景，而不是在它背后的场景。要做这个OCR，我的意思是神经网络有点过火，因为模因图像中的字符是简单的、直接的和向前的。我听说有其他“更简单”的方法来做OCR，比如使用机器学习算法来“学习”影响字体，或者使用基于骨架匹配的系统通过模式识别来识别字符。做OCR最好的方法是什么？而是神经网络？模式识别？机器学习？

浏览 0提问于2016-03-28得票数 1

回答已采纳

1回答

如何将tesseract配置更改为识别§并在R中应用pdftools::pdf_ocr_text？

、、、

我在R中使用pdftools从扫描和基于文本的PDF文件中提取文本。一个问题是§字符。这是不能被识别的。我查看了以下链接：我尝试了以下几点：我使用tesseract_info()找到了配置文件，并在configs下编辑了digits文件。digits文件内容如下： tessedit_char_whitelist 0123456789. 编辑后如下所示： tessedit_char_whitelist 0123456789-$§. 这并没有改变任何事情，我仍然无法提取§。它们仍然以8的形式出现。第一步失败后，我尝试了以下步骤：文件<- pdftools::pd

浏览 10提问于2020-12-01得票数 2

回答已采纳

1回答

从pyOCR没有可用的工具

、

我似乎没有正确地安装pyOCR，因为当我安装时，会得到一个空列表： import pyocr.builders pyocr.get_available_tools() 有什么想法吗？我已经通过pip在环境中安装了pyOCR： pip install pyocr --upgrade 编辑下面的人做了这个把戏。 sudo apt-get install tesseract-ocr sudo apt-get install tesseract-ocr-eng sudo apt-get install tesseract-ocr-ell

浏览 2提问于2015-08-08得票数 12