我正在使用Tesseract 2.04在一些图像中执行OCR,现在我必须获得文本的精确位置。但是这个版本不会返回这个信息。
我需要这个来生成一个可搜索的pdf文件。我已经学习了如何在pdf的底层中盖章文本,但我需要位置来盖章这个文本。我的第一个想法是在pdf中执行ocr,获取文本和文本的位置,用iText api在pdf中盖章。
发布于 2017-07-18 17:53:59
在iText内部,我们也对光学字符识别进行了研究。这是可能的(使用Tesseract)。
工作流程:
你可以做更多的优化。以下是简短的建议列表:
baseline
这不是一件容易的事情。但当然也有可能。
https://stackoverflow.com/questions/8390413
复制相似问题