使用Ruby和Ubuntu进行光学字符识别

光学字符识别（Optical Character Recognition，OCR）是将图像或图像中的文本内容转换为可编辑、可搜索的文本格式的过程。在使用 Ruby 和 Ubuntu 进行光学字符识别时，可以使用一些流行的 Ruby 库和开源工具。

以下是一些在 Ubuntu 系统上使用 Ruby 进行光学字符识别的方法：

使用 Tesseract OCR 引擎

Tesseract OCR 是一个免费的开源光学字符识别引擎，可以识别多种语言的文本。在 Ubuntu 系统上安装 Tesseract OCR 的方法如下：

sudo apt-get install tesseract-ocr

接下来，可以使用 Tesseract OCR 的 Ruby 绑定库 tesseract-ocr 来识别图像中的文本：

gem install tesseract-ocr

使用 tesseract-ocr 库的示例代码如下：

require 'tesseract-ocr'

tesseract = Tesseract::Ocr.new('path/to/image.png')
text = tesseract.to_s
puts text

使用 Google Cloud Vision API

Google Cloud Vision API 是一个强大的光学字符识别服务，可以识别图像中的文本、人脸、物体等。要在 Ruby 中使用 Google Cloud Vision API，需要安装 google-cloud-vision 库：

gem install google-cloud-vision

在 Ubuntu 系统上使用 Google Cloud Vision API 的示例代码如下：

require "google/cloud/vision"

vision = Google::Cloud::Vision.new
image = vision.image "path/to/image.png"
text = image.text
puts text

使用 Amazon Textract

Amazon Textract 是一个云端文本识别服务，可以识别图像中的文本、表格、表单等。要在 Ruby 中使用 Amazon Textract，需要安装 aws-sdk-textract 库：

gem install aws-sdk-textract

在 Ubuntu 系统上使用 Amazon Textract 的示例代码如下：

require 'aws-sdk-textract'

client = Aws::Textract::Client.new(region: 'us-west-2')

resp = client.detect_document_text({
  document: {
    s3_object: {
      bucket: 'my-bucket',
      name: 'path/to/image.png',
    },
  },
})

text = resp.blocks[0].text
puts text

以上是在 Ubuntu 系统上使用 Ruby 进行光学字符识别的一些方法，可以根据实际需求选择合适的方法。

使用Ruby和Ubuntu进行光学字符识别

ruby-on-rails、ruby、ubuntu、ocr、screen-scraping

我使用了GOCR将图像转换为文本，但我想将其与Ruby脚本一起使用，这样我就可以自动化这个过程，并为我的同学做同样的事情。我可以导航到这个网站。如何将图像保存到我的计算机上(运行UBUNTU)，使用GOCR转换图像，最后将其保存为文件，这样我就可以使用Ruby脚本再次访问它们？

浏览 0提问于2009-12-10得票数 5

1回答

保存并重新加载Abbyy的光学字符识别结果

ocr、abbyy、finereader、finereader12-sdk

假设我已经在Abbyy FindeReader中对多个PDF进行了光学字符识别。是否可以稍后在Abbyy FineReader中重新加载光学字符识别结果，以便纠正光学字符识别错误？我的想法是，我希望将执行OCR和(稍后)更正OCR结果分开

浏览 36提问于2020-10-09得票数 0

回答已采纳

1回答

Tesseract OCR iOS检测手写表单中的文本，并使用该文本自动填充联机表单

ios、objective-c、ocr、tesseract、handwriting-recognition

我已经使用Tesseract从扫描的文档中提取文本，并且我能够从扫描的文档中提取文本。现在，我想从手写表单(硬拷贝)中提取文本，并使用该文本自动填充我的在线表单(同一手写表单的软拷贝)。

浏览 1提问于2017-06-27得票数 2

3回答

建议使用OCR .NET

.net、ocr

您好，我刚刚在.NET中尝试了一个用于光学字符识别的组件，结果相当不准确。以前有没有其他人走过这条路？你能为我推荐一条路径来节省我评估大量产生不满意结果的组件的时间吗？任何建议都非常感谢。

浏览 1提问于2009-04-08得票数 0

4回答

如何在Tesseract和OpenCV之间进行选择？

python、opencv、computer-vision、ocr、tesseract

我最近遇到了和。看起来Tesseract是一个成熟的光学字符识别引擎，OpenCV可以作为一个框架来创建光学字符识别应用程序/服务。我试着在我的一些图像上使用Tesseract，它的准确性似乎还不错。后来，我发现了一个非常简单的关于使用OpenCV通过Python执行OCR的，这给我留下了深刻的印象。当然，采用这种方法意味着我需要使用大量的训练集来广泛地训练我的系统。如何在Tesseract和使

浏览 152提问于2012-07-15得票数 96

回答已采纳

1回答

在C#中使用Kofax

c#、ocr、kofax

在一个C#.Net项目中，我们有一个光学字符识别模块，用于读取纸质表格并将详细信息保存在SQL Server数据库中。我如何使用Kofax产品(可能是Kofax )来完成此任务？请分享您在使用C#进行光学字符识别处理时的经验。Chatura

浏览 2提问于2012-10-01得票数 1

1回答

我可以获得与特定文件关联的关键字列表吗？

google-drive-api

使用SDK可以做到这点吗？如果是这样的话，如何使用google的OCR来获取图像中的单词，如果没有，有什么建议吗？

浏览 1提问于2012-07-03得票数 25

回答已采纳

2回答

如何使用谷歌的AutoML进行光学字符识别

google-cloud-platform、ocr、google-cloud-vision、google-cloud-automl

但我有兴趣为它制作我的自定义模型，并希望使用AutoML实现相同的效果。但是我在AutoML上找不到任何与光学字符识别相关的东西。是否可以使用AutoML进行光学字符识别？我们该怎么做呢？

浏览 32提问于2020-06-25得票数 0

回答已采纳

1回答

aforge.net是否支持光学字符识别？

c#、image-processing、ocr、aforge、anpr

到目前为止，我已经用过Aforge.Net了，它也支持光学字符识别吗？谢谢

浏览 5提问于2012-07-21得票数 0

回答已采纳

1回答

具有OCR的移动电话应用程序

ocr

你应该知道，我使用诺基亚N95或一般的塞班操作系统的手机。以及我的app.contains字符识别(object character recognition)和文本到语音( TTS )。

浏览 5提问于2010-12-23得票数 0

1回答

在Pyocr中将文本方向从左更改为右

python、ocr、tesseract

我将pyocr与Pillow和OpenCV结合使用来从PDF文档中提取文本。但是，PDF文档是表单，这意味着在某些情况下，表单中项目的标签位于文档的最左侧，项目的值位于文档的右侧。我希望转换后的文本看起来像这样：下面是我目前使用的pyocr代码： def image_to_OCR(req_image_list,final_text

浏览 32提问于2017-07-01得票数 0

1回答

谷歌翻译手机应用程序是否使用Tesseract在本地进行OCR？

android、ios、ocr、tesseract、google-translate

与我在iOS上用Tesseract写的一个测试相比，这个应用程序在光学识别方面超级快速和准确。所以我想知道: Google翻译手机应用程序是否使用Tesseract在本地进行OCR？

浏览 0提问于2016-03-23得票数 2

5回答

有没有适用于Android的免费OCR库？

android、ocr

我正在寻找在Android上运行的Java OCR，然而Asprise似乎不是一个独立于平台的OCR。有没有开源/免费的Java OCR可以用来开发android应用程序？

浏览 49提问于2009-07-09得票数 149

1回答

如何使用iOS识别陡峭角度的文本？

ios、iphone、computer-vision

我尝试过使用Vision API，它可以很好地识别相对于相机直立、倒置或90度顺时针或逆时针的文本。如果文本旋转超出这个四分之一圈的范围，比如45度，Vision API始终找不到任何东西。

浏览 25提问于2020-03-11得票数 0

1回答

是否可能在图像和文本之间进行转换？

pdf、image-manipulation

我有一本扫描过的书作为图像压缩到PDF文件中，我希望保持原样，但希望从图像中提取文本，这样就可以选择/复制它。在Linux下有办法做到这一点吗？

浏览 0提问于2016-06-14得票数 0

回答已采纳

1回答

tesseract-ocr是否执行任何图像预处理？

c++、opencv、image-processing、ocr、tesseract

我目前正在使用Tesseract光学字符识别引擎，在将图像发送到光学字符识别引擎之前，我将使用它与OpenCV一起对图像进行预处理。我执行的一些预处理方法是adaptiveThreshold和GaussianBlur。编辑:我知道Tesseract做了基本的图像预处理。

浏览 1提问于2015-02-04得票数 1

10回答

光学字符识别软件推荐？

software-recommendation

我想直接扫描的版本一定是由一些光学字符识别软件处理的。请每个答案限制一个软件。

浏览 0提问于2010-10-22得票数 15

回答已采纳

1回答

解析jpg文件以提取信息/文本

machine-learning、jpeg

我计划写一个应用程序，自动解析JPG格式的费用收据，并自动提取金额，也使用一些学习算法进行分类。这是完全可行的吗？可以使用哪些库来解析jpg文件以从中提取文本信息和货币信息？

浏览 2提问于2010-06-25得票数 1

1回答

使用OpenCV检测表

opencv、computer-vision、vision

是否可以使用OpenCV检测标题文本区域，并对检测到的图像坐标后面的文本进行光学字符识别。 

浏览 3提问于2015-10-31得票数 8

回答已采纳

1回答

Howto:使用C#在光学字符识别前提高PDF质量

c#、pdf、ocr、readable

现在，对于光学字符识别，我们使用了Atalasoft的SDK ()。此外，条形码识别器也包含在此SDK中。以前有没有人这样做过，或者有过类似的问题？提前谢谢你！

浏览 2提问于2011-07-06得票数 5

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

使用Ruby和Ubuntu进行光学字符识别

相关·内容

使用Ruby和Ubuntu进行光学字符识别

保存并重新加载Abbyy的光学字符识别结果

Tesseract OCR iOS检测手写表单中的文本，并使用该文本自动填充联机表单

建议使用OCR .NET

如何在Tesseract和OpenCV之间进行选择？

在C#中使用Kofax

我可以获得与特定文件关联的关键字列表吗？

如何使用谷歌的AutoML进行光学字符识别

aforge.net是否支持光学字符识别？

具有OCR的移动电话应用程序

在Pyocr中将文本方向从左更改为右

谷歌翻译手机应用程序是否使用Tesseract在本地进行OCR？

有没有适用于Android的免费OCR库？

如何使用iOS识别陡峭角度的文本？

是否可能在图像和文本之间进行转换？

tesseract-ocr是否执行任何图像预处理？

光学字符识别软件推荐？

解析jpg文件以提取信息/文本

使用OpenCV检测表

Howto:使用C#在光学字符识别前提高PDF质量

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐