前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >【Rust日报】2024-01-03 一个用 Rust 编写的现代 OCR 引擎

【Rust日报】2024-01-03 一个用 Rust 编写的现代 OCR 引擎

作者头像
MikeLoveRust
发布2024-01-12 15:42:36
3870
发布2024-01-12 15:42:36
举报

ocrs -- 一个用 Rust 编写的现代 OCR 引擎(从图像中提取文本)

ocrs 是一个 Rust 库和 CLI 工具,用于从图像中提取文本,也称为 OCR(光学字符识别)。 ocrs 目标是创建一个现代 OCR 引擎:

  • 与 Tesseract 等早期引擎相比,可以很好地处理各种图像(扫描文档、包含文本的照片、屏幕截图等),预处理工作量为零或少得多。这是通过在管道中更广泛地使用机器学习来实现的。
  • 易于在各种平台上编译和运行,包括 WebAssembly
  • 接受过开放且自由许可的数据集的培训
  • 拥有易于理解和修改的代码库

在底层,该库使用在 PyTorch中训练的神经网络模型,然后将其导出到ONNX并使用RTen引擎执行。有关更多详细信息,请参阅模型部分。

命令行安装

要安装 CLI 工具,您首先需要安装 Rust 和 Cargo。然后运行:

代码语言:javascript
复制
$ cargo install ocrs-cli
CLI 用法

要从图像中提取文本,请运行:

代码语言:javascript
复制
$ ocrs image.png

当该工具第一次运行时,它会自动下载所需的模型并将其存储在~/.cache/ocrs.

其他示例

从图像中提取文本并写入content.txt:

代码语言:javascript
复制
$ ocrs image.png -o content.txt

从 JSON 格式的图像中提取文本和布局信息:

代码语言:javascript
复制
$ ocrs image.png --json -o content.json

注释图像以显示检测到的单词和线条的位置:

代码语言:javascript
复制
$ ocrs image.png --png -o annotated.png
模型和数据集

ocrs 使用用 PyTorch 编写的神经网络模型。有关模型和数据集以及用于训练自定义模型的工具的更多详细信息,请参阅 ocrs-models存储库。这些模型还提供 ONNX 格式,可与其他机器学习运行时一起使用。

  • https://github.com/robertknight/ocrs
本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2024-01-06,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 Rust语言学习交流 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • ocrs -- 一个用 Rust 编写的现代 OCR 引擎(从图像中提取文本)
    • 命令行安装
      • CLI 用法
        • 其他示例
          • 模型和数据集
          相关产品与服务
          云开发 CLI 工具
          云开发 CLI 工具(Cloudbase CLI Devtools,CCLID)是云开发官方指定的 CLI 工具,可以帮助开发者快速构建 Serverless 应用。CLI 工具提供能力包括文件储存的管理、云函数的部署、模板项目的创建、HTTP Service、静态网站托管等,您可以专注于编码,无需在平台中切换各类配置。
          领券
          问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档