首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
社区首页 >问答首页 >如何对低分辨率图像进行ocr

如何对低分辨率图像进行ocr
EN

Stack Overflow用户
提问于 2015-12-01 13:35:07
回答 2查看 4.2K关注 0票数 2

我必须从一个视频中提取文本,该视频具有类似于以下图像的经纬度数据:

图像的分辨率非常低,并且tesseract和online OCR在没有任何处理的情况下无法提取文本。我尝试使用this去除灰色背景,并减去灰色矩阵,但没有产生有意义的输出。我转换为HSV来提取黄色文本,但再次,没有得到有意义的结果。

我想知道是否有任何方法可以提取文本。最有希望的线索似乎是背景是灰色的,文本是半透明的黄色。

EN

回答 2

Stack Overflow用户

发布于 2015-12-01 15:46:31

这些图像的主要问题是分割字符。如果他们有一个固定的地方,你就完了。(跳过下一段。)

如果没有,首先通过轮廓分析定位字符组之间的空格,以简化任务。对于每个组,尝试识别最左边的字符,然后跳过它以转到下一个字符,依此类推。

字符的识别可以通过与相同字体的参考字符直接进行SAD或SSD比较来进行。

不要期待太好的结果。

票数 1
EN

Stack Overflow用户

发布于 2015-12-02 09:36:00

通常,DPI只是一个数字,所以您可以更改它(我不知道python中是如何更改的,但应该有一种方法)。在将其传递给OCR引擎之前,请尝试将其更改为200或300。如果这还不起作用,那么除了将DPI设置为300之外,还可以尝试将其调整为200%。此外,最好的OCR结果是针对黑白图像,因此尝试对图像应用图像处理,将其转换为黑白图像。我找到了以下链接,可能会对您有所帮助:Using python PIL to turn a RGB image into a pure black and white image

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/34021755

复制
相关文章
如何对图像进行卷积操作[通俗易懂]
2、卷积操作:卷积核与原图对应位置相乘再求和;然后将所求和放在被卷积操作的图中心位置。
全栈程序员站长
2022/08/26
2.9K0
如何对图像进行卷积操作[通俗易懂]
如何对RAW图像进行颜色校正
现在我们的图像已经是3个通道了,每一个通道的值都代表着对特定颜色波长的响应——你看,我们又涉及到颜色的本质了:颜色只是我们的感觉,波长和频率才是光的本质
HawkWang
2022/11/30
9410
如何对RAW图像进行颜色校正
使用 OpenCV 和 Tesseract 对图像中的感兴趣区域 (ROI) 进行 OCR
在这篇文章中,我们将使用 OpenCV 在图像的选定区域上应用 OCR。在本篇文章结束时,我们将能够对输入图像应用自动方向校正、选择感兴趣的区域并将OCR 应用到所选区域。
小白学视觉
2022/02/10
1.7K0
使用 OpenCV 和 Tesseract 对图像中的感兴趣区域 (ROI) 进行 OCR
如何对Bayer CFA图像进行去马赛克操作
这当然是因为这个相机Canon EOS 5D Mark II的传感器是带有标准Bayer Mosaic的CFA的。我们现在需要从上面的图中,恢复出完整的三个通道的颜色信息。
HawkWang
2022/11/30
1.2K0
如何对Bayer CFA图像进行去马赛克操作
利用opencv对图像进行长曝光
【Long exposure with OpenCV and Python】,仅做学习分享。
周旋
2020/09/22
1.4K0
在 Python 中对服装图像进行分类
图像分类是一种机器学习任务,涉及识别图像中的对象或场景。这是一项具有挑战性的任务,但它在面部识别、物体检测和医学图像分析等现实世界中有许多应用。
很酷的站长
2023/08/11
5661
在 Python 中对服装图像进行分类
使用Python对图像进行中值滤波
首先解答上一篇文章Python使用标准库subprocess调用外部程序中的问题,该题答案为['1', '2', '3', '4'],在正则表达式中,问号(?)有两种含义,一种是表示前面的字符或模式可
Python小屋屋主
2018/04/16
5.9K0
使用Python对图像进行中值滤波
对单张图像循环进行多次超分辨,图像增强,去模糊等图像处理是否合理?以及如何评价图像质量?
对单张图像循环进行多次超分辨,图像增强,去模糊等图像处理是否合理?以及如何评价图像质量?
周旋
2022/08/07
7680
对单张图像循环进行多次超分辨,图像增强,去模糊等图像处理是否合理?以及如何评价图像质量?
RestoreDet:低分辨率图像中目标检测
论文地址:https://arxiv.org/pdf/2201.02314.pdf
计算机视觉研究院
2022/01/28
1K0
RestoreDet:低分辨率图像中目标检测
如何对列表进行搜索
logic [31:0] ram_block[1024] = '{default:0}
Lauren的FPGA
2019/10/30
2.8K0
使用神经网络对图像进行卡通化
Cartoonizer项目允许用户生成其高质量图像的卡通化表示。 在咨询了许多卡通艺术家并观察了卡通绘画行为之后,该研究项目由王新瑞和于进泽提出,以从图像中分别识别出三种白盒表现形式: 表面表示:它包含卡通图像的光滑表面。 结构表示:是指赛璐style风格的工作流程中稀疏的色块和平坦的全局内容。 纹理表示:它可以反映卡通图像中的高频纹理,轮廓和细节。 为了在输入图像上获得卡通效果,如下所示GAN(生成对抗网络)框架用于学习提取的表示并将图像卡通化。 代码可用于使用此研究项目来实现图像的卡通化。 一些结果输出
博文视点Broadview
2023/04/19
4600
使用神经网络对图像进行卡通化
使用神经网络对图像进行卡通化
在咨询了许多卡通艺术家并观察了卡通绘画行为之后,该研究项目由王新瑞和于进泽提出,以从图像中分别识别出三种白盒表现形式:
代码医生工作室
2020/10/23
1.2K0
使用神经网络对图像进行卡通化
如何对DFX设计进行调试?
对于DFX设计,那么就只能使用实例化方式插入ILA。但即便如此,仍有一些特殊之处。为便于说明,我们看一个实际案例。这个DFX设计中的RP(Reconfigurable Partition)为math,该RP下有两个RM(Reconfigurable Module),分别为add和mult,如下图所示。每个RM中均包含一个ILA。这个ILA无论参数配置是否一致,都要分别调用ILA IP Core,单独例化。这是DFX设计所要求的,即每个IP都要以唯一的方式存在于RM中。
Lauren的FPGA
2023/08/18
4750
如何对DFX设计进行调试?
OCR文本图像合成工具
在进行文字识别时候,需要使用的数据集样式为一张含有文本的图片以及对应文本内容的标签。但是一般而言,实际情况是构建的文本字典中,每个字至少要出现200次才能有好的识别效果,因此,先对所有的label进行单字统计,看每个字出现的个数是否超过200次,如果不满足,则需要进一步收集数据。
用户3578099
2020/11/03
1.9K0
如何对图片进行卷积计算
先导入torch和torch里的nn类,然后设置一个指定尺寸的随机像素值的图片,然后使用nn.conv2d函数进行卷积计算,然后建立全连接层,最后得到新的图片的尺寸
算法与编程之美
2023/08/22
2290
如何对图片进行卷积计算
如何对代码进行调优?
为了减少数据上的常见运算所需要的时间,我们通常可以在数据结构中增加额外的信息,或者修改数据结构中的信息使之更易访问
用户9831583
2022/06/16
1.1K0
python如何对类进行测试
下面介绍针对类的测试,很多程序中都会用到类,因此能够证明你的类能够正确地工作会大有裨益。如果针对类的测试通过了,你就能确信对类所做的改进没有意外地破坏其原有的行为。
狼啸风云
2019/03/19
4.4K0
如何对集成树进行解释?
集成树(tree-based ensemble learning)中,最有名的就是随机森林树(Random Forest,简称RF)与梯度提升树(Gradient Boosting Trees,简称GBM)。而近年在Kaggle 竞赛平台中最火红的XGBoost 也是基于GBM 所延伸出来的演算法。在解释集成树有三个非常好用的方法: 特征重要度(Feature Importance) 部分相依图(Partial Dependence Plot,简称PDP) 个体条件期望图(Individual Conditional Expectation Plot,简称ICE Plot) 这三个方法属于「事后可解释性(post hoc)」并且「通用于任何一种演算法模型(model-agnostic)」。
致Great
2020/12/29
1.4K0
使用3D Slicer对图像进行配准
在进行深度学习之前,我们需要图像进行一些预处理操作,其中配准是很重要的一环,以下将介绍使用软件3D Slicer来进行图像配准
范中豪
2019/09/10
2.3K0
使用3D Slicer对图像进行配准
使用 CLIP 对没有任何标签的图像进行分类
深度图像分类模型通常在大型带注释数据集上以监督方式进行训练。尽管模型的性能会随着更多注释数据的可用而提高,但用于监督学习的大规模数据集通常难以获得且成本高昂,需要专家注释者花费大量时间。考虑到这一点,人们可能会开始怀疑是否存在更便宜的监督资源。简而言之,是否有可能从已经公开可用的数据中学习高质量的图像分类模型?
小白学视觉
2022/12/27
3.5K0
使用 CLIP 对没有任何标签的图像进行分类

相似问题

对OCR图像进行倾斜和过滤

22

如何对刻字进行OCR?

44

对非常相似的图像进行排序PHP OCR

20

用OpenCv Java对水表图像进行预处理,用Tesseract对OCR进行图像预处理

15

如何对图像的选定部分执行ocr

17
添加站长 进交流群

领取专属 10元无门槛券

AI混元助手 在线答疑

扫码加入开发者社群
关注 腾讯云开发者公众号

洞察 腾讯核心技术

剖析业界实践案例

扫码关注腾讯云开发者公众号
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
查看详情【社区公告】 技术创作特训营有奖征文