文章/答案/技术大牛

发布

社区首页 >问答首页 >计算机视觉

问计算机视觉
EN

Stack Overflow用户

提问于 2018-05-28 12:40:26

回答 3查看 278关注 0票数 1

我对计算机视觉很陌生。我试图从视频帧和图像中提取文本。github中提供的大多数代码都与python <3版本兼容。任何关于如何进行和获取相关代码和好文件的想法。

注意:我已经实现了pytesseract-OCR，而且没有取得好的效果。

从这张图片中，我必须提取宏碁

computer-vision

text-extraction

回答 3

Stack Overflow用户

回答已采纳

发布于 2018-06-18 06:23:28

你好，TISHANT CHANDRAKAR。

首先，您必须了解文本识别器的工作原理。

1. have-text-region is extracted from the image
2. we recognize text for each region
3. Combine the text of all regions to form final result

Tesseract本身对于步骤2非常有效，但是对于步骤1，它只对文档中的文本很好地工作。在计算机视觉中，第一步被称为“场景文本检测”。因此，下一步是找到一些好的代码，或纸，可以做“现场文本检测”。

如果你想学习和阅读报纸，这里有一个列表，场景文本检测列表。但是在我看来，你图像中的文本是黑色背景上的白色文本，所以简单的颜色阈值可以很容易地解决第一步。

希望能有所帮助

票数 0

Stack Overflow用户

发布于 2021-11-02 22:38:20

有许多存储库用于文本检测和识别，tesseract并不坏，但是您需要像识别oem那样正确地配置它，psm参数按照下面的链接来获得更多的最佳实践。

https://ai-facets.org/tesseract-ocr-best-practices/

在您的示例图像上，重要的是文本检测和预处理步骤，如deskew校正，您可以检查OpenCV示例。

票数 0

Stack Overflow用户

发布于 2022-12-03 02:35:27

有几种从图像中提取文本的方法，最有效的方法将取决于输入图像的质量和用例的具体需求。一般来说，从图像中提取文本的第一步是对输入图像进行预处理，以提高图像的质量，使文本提取算法更容易识别文本。这可以包括去噪图像、校正透视失真和增强对比度等步骤。

在对输入图像进行预处理之后，可以使用几种技术来提取文本。一些常见的技术包括：

光学字符识别( OCR )：OCR算法使用机器学习技术来识别和识别图像中的文本。OCR算法通常是在大型的标记文本图像数据集上进行训练，并学习根据文本的视觉特征来识别和分类文本。OCR算法可以有效地从图像中提取文本，但它们对文本的字体、大小和其他视觉特征的变化非常敏感。
基于特征的方法:在某些情况下，可以使用基于特征的方法从图像中提取文本，从而识别文本的特定视觉特征。例如，可以训练算法来识别字母的边缘、直线相交的角度或其他可用于分割和分类文本的视觉特征。这些算法可以有效地从布局相对简单的图像中提取文本，但当文本杂乱或重叠时，这些算法的效率可能较低。
混合方法:许多文本提取算法使用OCR和基于特征的方法相结合的方法从图像中提取文本。例如，一个算法可能首先使用OCR来识别图像中文本的一般位置，然后使用基于特征的技术对该区域内的文本进行分割和分类。混合方法可以有效地从广泛的图像中提取文本，但它们也可以更复杂和计算更密集。

在Python中用于文本提取的特定库和资源方面，有几种可用的选项。一些流行图书馆包括：

PyTesseract: PyTesseract是Tesseract OCR引擎的包装器，这是谷歌开发的开源OCR引擎。PyTesseract可以用多种语言从图像中提取文本，它包括对图像预处理和后处理的支持，以提高OCR结果的准确性。
OpenCV: OpenCV是一个开源的计算机视觉库，它包含了许多图像处理和计算机视觉的算法，包括文本提取。OpenCV可用于执行广泛的任务，包括预处理、特征提取和文本识别。
scikit图像: scikit-image是一个用于图像处理的Python库，它包括文本提取算法和其他图像分析任务。scikit图像包括预处理、特征提取和分类等功能，它可以与其他机器学习库相结合来构建文本提取系统。

在论文和其他资源方面，有许多关于从图像中提取文本的研究论文和教程。一些良好的起点可以包括以下几点：

OpenCV文档

票数 0

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/50566726

复制

相似问题

问计算机视觉
EN

回答 3

Stack Overflow用户

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问计算机视觉EN

回答 3

Stack Overflow用户

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问计算机视觉
EN