首页
学习
活动
专区
工具
TVP
发布
社区首页 >问答首页 >与Tesseract相比,PaddleOCR的性能如何?

与Tesseract相比,PaddleOCR的性能如何?
EN

Stack Overflow用户
提问于 2021-06-16 15:18:12
回答 5查看 5.1K关注 0票数 6

最近我遇到了PaddleOCR,我想知道这个OCR系统与Tesseract相比是怎样的。是否有可用的数据或基准?

EN

回答 5

Stack Overflow用户

回答已采纳

发布于 2021-06-16 17:34:06

我发现了PaddleOCR 2和Tesseract 4之间的一个比较,但只针对英语文本。简要概述:

  1. PaddleOCR比GPU上的Tesseract稍慢一些,但是有了GPU的支持,它在标准GPU上比Tesseract高出46%。
  2. 在没有后置处理的情况下,PaddleOCR主要是在单词和标点符号之间缺少空格的情况下出错.然而,这些错误可以很容易地纠正。经过后处理,精度与Tesseract相当(低1%)。
  3. 经过预培训的英语模型只有Tesseracts英语列车数据文件大小的10% (2MB对23 2MB)。

对于目前看来是PaddleOCR的主要优先事项的中文文本来说,情况可能有所不同。

票数 2
EN

Stack Overflow用户

发布于 2022-03-09 17:07:20

我在一些研究中使用这两种方法已经将近一年了。我可以说,每个人都有自己完美的用途。

PaddleOCR的优点:

  1. 如果文本在非90度旋转中旋转,PaddleOCR仍然可以正确地检测到某些文本,但是即使使用OSD,PaddleOCR也无法做到这一点。
  2. 您可以使用检测结果来修复旋转,但是Tesseract很可能检索无意义的结果。
  3. 如果不能对图像进行二值化,PaddleOCR比RGB/BGR中的图像更好。

Tesseract的优点:

  1. 即使在操作参数之后,PaddleOCR在检测空间方面也有严重的问题,但是在下一次升级时,他们正在致力于修复这个问题。Tesseract没有明显的空间问题。
  2. Tesseract在处理扫描文档()方面更好。
  3. 图像分割模式对于救援和提高图像分割效果有很大帮助。
  4. 对于具有文本的二值化图像,Tesseract的效果通常优于PaddleOCR。
  5. Tesseract在检测符号方面要好得多。
  6. Tesseract是上速度更快的

简而言之,使用Tesseract将非常适合于扫描文档和PaddleOCR用于通用计算机视觉项目

票数 4
EN

Stack Overflow用户

发布于 2021-07-12 21:28:24

我用它们测试了英语和日语,但有趣的是,PaddleOCR似乎比Tesseract更能识别它们。PaddleOCR的文本检测似乎也更好。然而,根据他们的帖子,PaddleOCR不能很好地处理空间,并且有来自非中国(或日本)用户的抱怨。PaddleOCR非常渴望将最新的识别/检测算法作为研究论文发表,我已经决定使用PaddleOCR。

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/68005555

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档