我对计算机视觉很陌生。我试图从视频帧和图像中提取文本。github中提供的大多数代码都与python <3版本兼容。任何关于如何进行和获取相关代码和好文件的想法。
注意:我已经实现了pytesseract-OCR,而且没有取得好的效果。
发布于 2018-06-18 06:23:28
你好,TISHANT CHANDRAKAR。
首先,您必须了解文本识别器的工作原理。
1. have-text-region is extracted from the image
2. we recognize text for each region
3. Combine the text of all regions to form final resultTesseract本身对于步骤2非常有效,但是对于步骤1,它只对文档中的文本很好地工作。在计算机视觉中,第一步被称为“场景文本检测”。因此,下一步是找到一些好的代码,或纸,可以做“现场文本检测”。
如果你想学习和阅读报纸,这里有一个列表,场景文本检测列表。但是在我看来,你图像中的文本是黑色背景上的白色文本,所以简单的颜色阈值可以很容易地解决第一步。
希望能有所帮助
发布于 2021-11-02 22:38:20
有许多存储库用于文本检测和识别,tesseract并不坏,但是您需要像识别oem那样正确地配置它,psm参数按照下面的链接来获得更多的最佳实践。
https://ai-facets.org/tesseract-ocr-best-practices/
在您的示例图像上,重要的是文本检测和预处理步骤,如deskew校正,您可以检查OpenCV示例。
发布于 2022-12-03 02:35:27
有几种从图像中提取文本的方法,最有效的方法将取决于输入图像的质量和用例的具体需求。一般来说,从图像中提取文本的第一步是对输入图像进行预处理,以提高图像的质量,使文本提取算法更容易识别文本。这可以包括去噪图像、校正透视失真和增强对比度等步骤。
在对输入图像进行预处理之后,可以使用几种技术来提取文本。一些常见的技术包括:
在Python中用于文本提取的特定库和资源方面,有几种可用的选项。一些流行图书馆包括:
在论文和其他资源方面,有许多关于从图像中提取文本的研究论文和教程。一些良好的起点可以包括以下几点:
https://stackoverflow.com/questions/50566726
复制相似问题