ocrs 是一个 Rust 库和 CLI 工具,用于从图像中提取文本,也称为 OCR(光学字符识别)。 ocrs 目标是创建一个现代 OCR 引擎:
在底层,该库使用在 PyTorch中训练的神经网络模型,然后将其导出到ONNX并使用RTen引擎执行。有关更多详细信息,请参阅模型部分。
要安装 CLI 工具,您首先需要安装 Rust 和 Cargo。然后运行:
$ cargo install ocrs-cli
要从图像中提取文本,请运行:
$ ocrs image.png
当该工具第一次运行时,它会自动下载所需的模型并将其存储在~/.cache/ocrs.
从图像中提取文本并写入content.txt:
$ ocrs image.png -o content.txt
从 JSON 格式的图像中提取文本和布局信息:
$ ocrs image.png --json -o content.json
注释图像以显示检测到的单词和线条的位置:
$ ocrs image.png --png -o annotated.png
ocrs 使用用 PyTorch 编写的神经网络模型。有关模型和数据集以及用于训练自定义模型的工具的更多详细信息,请参阅 ocrs-models存储库。这些模型还提供 ONNX 格式,可与其他机器学习运行时一起使用。