腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
视频
沙龙
1
回答
如何在自然文本图像中检测字符?
、
、
我有一个关于字符识别的项目(使用openCV库)。我不知道如何在文本图像中检测字符。你能推荐一些方法来做到这一点吗?谢谢大家!
浏览 5
提问于2013-11-28
得票数 0
1
回答
使用OpenCV检测表
、
、
我经常处理扫描过的文件。论文包含表格(类似于Excel表格),我需要手动输入到计算机中。更糟糕的是,这些表可以有不同的列数。至少可以说,手动将它们输入到Excel中是很普通的。 我想如果我能把一个程序用来OCR的话,我可以省下一周的工作。是否可以使用OpenCV检测标题文本区域,并对检测到的图像坐标后面的文本进行光学字符识别。 我能在OpenCV的帮助下实现这一点吗?或者我需要完全不同的方法? 编辑:示例表格实际上只是一个标准表格,类似于您可以在Excel和其他电子表格应用程序中看到的表格,如下所示。
浏览 3
提问于2015-10-31
得票数 8
回答已采纳
4
回答
如何在Tesseract和OpenCV之间进行选择?
、
、
、
、
我最近遇到了和。看起来Tesseract是一个成熟的光学字符识别引擎,OpenCV可以作为一个框架来创建光学字符识别应用程序/服务。 我试着在我的一些图像上使用Tesseract,它的准确性似乎还不错。后来,我发现了一个非常简单的关于使用OpenCV通过Python执行OCR的,这给我留下了深刻的印象。在几分钟内,我完成了系统的训练,它的准确性很好。当然,采用这种方法意味着我需要使用大量的训练集来广泛地训练我的系统。 我的具体问题如下: 如何在Tesseract和使用OpenCV构建自定义光学字符识别应用程序之间进行选择?有针对不同语言的Tesseract的训练数据集。OpenCV有没有类似的
浏览 152
提问于2012-07-15
得票数 96
回答已采纳
1
回答
Tesseract OCR iOS检测手写表单中的文本,并使用该文本自动填充联机表单
、
、
、
、
我已经使用Tesseract从扫描的文档中提取文本,并且我能够从扫描的文档中提取文本。现在,我想从手写表单(硬拷贝)中提取文本,并使用该文本自动填充我的在线表单(同一手写表单的软拷贝)。有人知道怎么做吗? 提前感谢你的帮助。
浏览 1
提问于2017-06-27
得票数 2
1
回答
在Pyocr中将文本方向从左更改为右
、
、
我将pyocr与Pillow和OpenCV结合使用来从PDF文档中提取文本。但是,PDF文档是表单,这意味着在某些情况下,表单中项目的标签位于文档的最左侧,项目的值位于文档的右侧。例如(添加点作为间距,但不存在于图像中): oranges:......................................$15.75的价格 apples:.......................................$12.51的价格 当我将图像转换为文本时,它将如下所示: 橙子价格:/n苹果价格/n$15.75/n$12.51 基本上,文本是从上到下,然后从左到右,而不是从左到右,然
浏览 32
提问于2017-07-01
得票数 0
1
回答
阅读图片中的文本的最佳Python/Ruby库
、
、
、
、
有没有人知道python/ruby中可以分析图像并从中提取文本的库? 或者是一本关于图像处理的书。 PS:文本是各种字体和格式,但清晰,Tl;Dr:没有验证码或类似的。
浏览 2
提问于2012-07-15
得票数 3
回答已采纳
1
回答
是否有任何不基于OCR的通用布局分析库或工具?
、
我正在寻找布局分析库或工具(最好是开源的),可以应用于文本PDF,以识别主要文本内容与侧栏,章节标题,章节标题(甚至可能是具有装饰/阴影和下划线的花哨的标题)等。我遇到了像OCRopus这样的工具,它们使用光学字符识别和图像识别来识别布局。有没有库可以在没有OCR的情况下做同样的事情?可以从文本PDF中提取文本和图像,并将包含文本和图像位置的输入提供给该工具;对于此类文件使用OCR将是相当繁琐的。
浏览 2
提问于2013-05-08
得票数 2
回答已采纳
1
回答
如何从表单的扫描图像中提取数据?
、
、
、
我有一些扫描表单的数据。表格的格式是预定义的,我也有空表格的图像。我想从表单中提取每个值的信息。任何已知的用于图像处理的R或python解决方案或库都可以帮助实现这些值。我已经在python中尝试过openCv,但是没有成功。有什么解决方案吗? PFA这两种类型的图像我都有截图。 空表单图像:- 已填写表单图像:-
浏览 1
提问于2017-07-22
得票数 4
1
回答
我可以获得与特定文件关联的关键字列表吗?
也就是说,对于执行OCR的图像,我希望能够获取图像上的文本列表。使用SDK可以做到这点吗?如果是这样的话,如何使用google的OCR来获取图像中的单词,如果没有,有什么建议吗?
浏览 1
提问于2012-07-03
得票数 25
回答已采纳
1
回答
有没有办法在C#中“读”一个gif/jpeg文件?
、
我需要从gif/jpeg中读取具有文本和图像组合的文本。希望所有的gif都是标准格式,以便我使用regex (也许?)从图像中提取文本。 任何关于这方面的意见都是非常感谢的。
浏览 0
提问于2009-10-31
得票数 0
1
回答
提取PDF中表示为图像的文本- itextsharp
、
、
、
我在使用ITextSharp从PDF文件中提取文本的过程中,我已经成功地提取了我感兴趣的文本的一部分,但当我继续我的‘文本’提取时,我注意到一些文本单词(当我使用itextsharp从整个页面提取整个文本时无法获得文本)实际上被表示为图像。Adobe Reader已经向我确认了这一点。因此,简而言之:如何提取包含在PDF图像对象中的文本?我是否必须提取图像并找到另一种方法将其转换为文本?这是一个非常可怕的行星排列对我来说..有人遇到过这个问题吗?
浏览 4
提问于2013-06-07
得票数 2
回答已采纳
1
回答
iPhone中具有文本检测功能的增强现实引擎
、
、
、
我想创建一个类似的应用程序来"“谁知道任何增强现实软件开发工具包,可以检测文本和它的位置从摄像头馈送/视频?或者任何人都可以给我任何指针,告诉我应该从哪里开始?
浏览 1
提问于2012-07-09
得票数 3
2
回答
屏幕文本的OCR (光学字符识别)
、
、
、
我正在尝试创建一个软件,通过捕获屏幕截图,然后OCR (光学字符识别)它寻找一个特定的按钮来点击(例如)的PC自动化。我已经得到了鼠标和键盘控制部分,但现在,我需要一个OCR来处理屏幕截图。我发现Tesseract OCR似乎不能很好地处理屏幕上的文本。文本要么太小,要么一些文本似乎是连接在一起的,比如K和X。我该怎么做呢? p/s:这是一个自动化测试程序。
浏览 1
提问于2009-05-22
得票数 4
2
回答
图像预处理tesseract
、
、
、
我正在做一个名片扫描仪,用于我关于数字图像处理的期末考试,我想问你,我必须如何对名片的照片进行预处理,以便tesseract能够识别文本。我尝试了很多方法,像侵蚀,扩张,阈值,但我不能有一个好的结果…你能帮帮我吗? 谢谢 马可
浏览 2
提问于2012-08-09
得票数 1
2
回答
通过Javascript或PHP将图像转换为文本?
、
、
可能重复: 是否有任何脚本可以将包含文本的图像转换为纯文本,最好使用Javscript或PHP?例如,以下面的图像为例: 我希望这个图像被转换成简单的“ABCDEFGHIJK”。
浏览 5
提问于2012-04-16
得票数 2
回答已采纳
4
回答
将图像转换为文本- Java
、
、
、
这是一个有趣的话题。基本上,我有一个包含一些文本的图像。如何从图像中提取文本? 我已经尝试了很多东西,但我做的每一件事都非常单调乏味,而且通常都不起作用。我只是想知道是否有一种相当简单的方法来做到这一点。 我发现了这一点:。我已经试了几个小时了,但我不能让它从图像中获取Image并将其转换为文本的String。 提前感谢大家!
浏览 6
提问于2012-05-03
得票数 12
回答已采纳
1
回答
将图像转换为wp7文本
我正在为wp7开发应用程序,并且对这些东西很陌生。我希望将图像转换为文本,就像选择现有图像或捕获新图像一样,如果该图像中存在文本,则应该在TextBox上显示这些文本。有人能帮我这个忙吗?提前谢谢!
浏览 1
提问于2013-02-09
得票数 1
回答已采纳
1
回答
Android获取图片和获取捕获图片中的文本
、
我正在尝试制作一个应用程序,通过使用android来拍摄图像,然后从捕获的图像中获取文本(它可能像OCR一样)。如果有人知道这件事,请帮帮我。谢谢。
浏览 0
提问于2012-10-31
得票数 0
1
回答
从uiimageView读取
、
我想知道,从相机中获取图像是可能的,如果图像包含任何数字,它会从图像中读取这些数字,并在文本字段中显示它们。我读到过关于ZBAr的文章,但这完全是另一回事。有没有人知道类似的事情? 谢谢
浏览 0
提问于2011-04-01
得票数 1
回答已采纳
1
回答
文本识别库,Android代码,Java?
、
、
、
有人能推荐一个适用于Android、Java的文本识别库或代码吗?我需要从图像中进行一些文本识别。我只能找到与android图像类不完全兼容的Java代码。
浏览 1
提问于2012-12-26
得票数 2
1
回答
图像处理:根据字体类型和大小对文本进行分类的API
、
、
我正在寻找一个API,可以将图像作为输入,并根据字体类型和字体大小对图像中的文本进行分类/识别。现在,这些图像是移动应用程序中的屏幕截图,因此代表了完美的字体,并且不会像手写文本或打印文档的图像那样失真。我浏览了一些可用的API,比如Google Vision API,但我找到了一个解决方案。 任何帮助都将不胜感激。提前谢谢。
浏览 0
提问于2017-10-20
得票数 3
2
回答
如何使用Java读取图像?
、
、
、
我一直在使用一个软件,作为一个阅读扫描仪的工作。基本上,它从图像中检索文本。是否有任何API能够以编程方式识别图像中包含的文本,特别是.tiff中的常规文本?或者有什么Java类可以帮助.我不知道怎么开始
浏览 4
提问于2013-10-05
得票数 2
回答已采纳
1
回答
在matlab中使用深度学习进行文本检测的简单两类(二进制)分类
、
我对这个领域是完全陌生的,特别是在matlab方面。因此,我需要训练或使用预先训练好的模型来进行文本检测。我不需要它来识别文本类,我只想让它告诉我,我给cllasifier的一个区域是文本还是不是。文本是英文的,可以是任何形式或字体。 因此,我们可以说图像将被裁剪或完全没有背景,我需要确定它的文本或没有。 我的问题是,有没有这样一个预先训练好的模型?或者我必须自己训练它?如果我应该训练它,我需要多少数据,以及在具有以下规格的笔记本电脑上需要多少时间: cpu :酷睿i7, gpu: gtx-960m, ram: 16 ram 提前谢谢。我真的很短的时间来做这件事,所以如果有任何预先训练的选择
浏览 19
提问于2019-12-27
得票数 0
3
回答
建议使用OCR .NET
、
您好,我刚刚在.NET中尝试了一个用于光学字符识别的组件,结果相当不准确。以前有没有其他人走过这条路?你能为我推荐一条路径来节省我评估大量产生不满意结果的组件的时间吗? 任何建议都非常感谢。我不介意自己购买或编写代码。只要效果最好,性价比最高的。 谢谢
浏览 1
提问于2009-04-08
得票数 0
3
回答
java的任何OCR技术
、
我有MCA最后一年的项目,以提取数据从图像(jpg,gif等)。我想从图像中识别数据。我已经使用了java ocr,但它不工作。有没有可以帮到我的开源库?
浏览 0
提问于2010-03-10
得票数 0
1
回答
OCR中的图像预处理
、
我们的项目是关于OCR的,根据我的研究,在进行字符识别之前,它会经过预处理阶段。我知道我们可以使用openCV来实现这一点,但我们不能根据我们的规则使用它。 我的问题是,谁能告诉我预处理的一步一步和最好的方法/算法。 就像我所知道的, 1.YUVluminace 2.greyscale 3.otsu阈值 4.Binarization 5.霍夫变换 原始Image> YUVluminace>灰度下一步是什么?? 谢谢!
浏览 6
提问于2014-08-14
得票数 0
2
回答
检测只包含文本的图像
、
、
、
我有一个数据库,里面有两种图像: 图片与文字整合与否 只包含背景颜色和文本的图像。 我有一个,我只想发送给客户的照片。是否存在任何简单而快速的算法来检测图像是否仅仅是一个背景,上面有文本?应该使用什么类型的方法? 提前感谢
浏览 6
提问于2012-07-10
得票数 4
回答已采纳
1
回答
具有OCR的移动电话应用程序
我要开发我的移动应用程序,我是新手,我想知道哪种编程语言比较好,是Symbian、C++还是QT?你应该知道,我使用诺基亚N95或一般的塞班操作系统的手机。以及我的app.contains字符识别(object character recognition)和文本到语音( TTS )。
浏览 5
提问于2010-12-23
得票数 0
1
回答
是否可能在图像和文本之间进行转换?
、
我有一本扫描过的书作为图像压缩到PDF文件中,我希望保持原样,但希望从图像中提取文本,这样就可以选择/复制它。 在Linux下有办法做到这一点吗?
浏览 0
提问于2016-06-14
得票数 0
回答已采纳
1
回答
Android OCR (光学字符识别)
、
、
我想开发一个从图像中读取文本的应用程序。我应该使用哪个库?
浏览 0
提问于2011-08-19
得票数 2
回答已采纳
2
回答
iOS Objective-C中的自动白平衡
、
、
、
我正在尝试修复iOS上一张图片的白平衡。在我的应用程序中,人们可以拍一张照片,然后得到两样东西: OCR和图像的“改进”版本。 为了进行光学字符识别,我使用GPUImage (使用GPUImageAdaptiveThresholdFilter)改进了图像。但该图像仅由黑白像素组成。对于我的“改进”版本,我想要有:-正确的颜色平衡(意思是当我在里面拍照时,我的白色是真正的白色而不是黄色)-良好的对比度。 我试过用GPUImageContrastFilter和GPUImageWhiteBalanceFilter。GPUImageWhiteBalanceFilter运行良好,但GPUImageWhi
浏览 0
提问于2016-02-04
得票数 0
1
回答
Python Google Drive API :上传的图像显示在文档中
、
我正在使用以下代码从我的python应用程序将图像上传到google drive: import logging from django.core.management.base import BaseCommand from apiclient.discovery import build from apiclient.http import MediaFileUpload import httplib2 from gdoauth2.models import DriveCredential class Command(BaseCommand): def handle(s
浏览 0
提问于2013-06-14
得票数 0
回答已采纳
1
回答
如何在纸上扫描文本,将其存储在文件中,然后使用该信息
、
、
、
我正在进行一个项目,要求我扫描(或拍照)一篇论文中的文本,然后将其处理为文本文件,然后使用文本文件中的信息触发另一个操作(例如,如果第一个字母是"A“,那么.),所有这些都在同一个应用程序中。任何方法都会有很大的帮助,但如果我能够在使用Eclipse的android应用程序中实现这一点,那将是非常完美的。
浏览 4
提问于2014-06-06
得票数 1
回答已采纳
1
回答
无法从弹出窗口提取文本
、
、
我无法从弹出窗口中提取或获取文本。我使用了下面的代码: Driver.findElement(By.xpath("xpath of popup")).getText(); 这是一个div图像弹出窗口(如果有帮助的话)。我想将文本从窗口中取出并在控制台中打印出来。当我使用上面的代码时,它只是通过了测试,并没有从图像中获得文本。
浏览 4
提问于2014-12-05
得票数 0
1
回答
以编程方式从图像中读取文本
、
、
我的问题类似于,只不过我正在寻找一种以编程方式实现它的方法。 从本质上说,是否有人知道一个好的、简单的、与.NET兼容的库,它能够接收到一个位图对象或图像对象,并返回该图像上的任何文本? 干杯
浏览 3
提问于2009-06-29
得票数 0
回答已采纳
1
回答
基于Jmeter的图像文本提取
、
、
、
我需要从磁盘上的图像中提取数字(数字)。我们有没有可以做到这一点的jmeter的库/插件?例如,我有一个图像 在磁盘上,我想从这个图像中提取数字。我的输出应该是: 5693478605
浏览 1
提问于2016-11-09
得票数 0
2
回答
图像处理软件
我需要处理图像中的文本。该图像是仪表读取数据的图像。我尝试了和其他几个免费的在线图像处理软件,但他们不能正确读取数据。 哪些是最好的图像处理软件(包括免费软件和共享软件),可以准确读取仪表数据? PS:我需要从处理后的图像中获得准确的读数。所以,我不能处理不恰当的数据。 要处理的图像可以在链接上找到。
浏览 2
提问于2013-08-26
得票数 0
2
回答
Windows Phone 7.5中的扫描文本(OCR)
、
、
、
、
有没有办法强制只扫描文本?我正在寻找在windows phone中扫描文本的离线(非云)解决方案。 或 集成的Bing视觉成功地扫描了图像中的文本。有没有办法在我们的应用程序中调用相同的任务(类似于Microsoft.Phone.Tasks)?
浏览 0
提问于2012-04-16
得票数 4
回答已采纳
1
回答
Flutter IOS实时文本功能
、
我希望将ios的实时文本功能添加到flutter文本字段中,但似乎在网上找不到任何关于如何完成此操作的资源。我已经尝试添加了一个库比蒂诺文本字段,但也不起作用。附件中的图像显示了我正在具体讨论的功能 ?
浏览 20
提问于2021-11-03
得票数 0
回答已采纳
1
回答
识别文本并显示它
我用处理编程语言编写了一个油漆应用程序。我希望识别油漆应用程序中的字母和/或单词I或用户位置,并在终端中打印出来,以便开始。 例如,如果用户绘制了以下文本: 然后单词堆栈将被打印到终端。 我在谷歌上搜索到自然语言可以被使用。但在阅读了这方面的理论之后,我很难运用这个理论。 有谁对简单的方法有什么建议吗? 非常感谢!
浏览 3
提问于2013-11-20
得票数 1
回答已采纳
1
回答
如何使用iOS识别陡峭角度的文本?
、
、
我有一个问题,涉及识别与iPhone相机成任何角度的文本。我尝试过使用Vision API,它可以很好地识别相对于相机直立、倒置或90度顺时针或逆时针的文本。 如果文本旋转超出这个四分之一圈的范围,比如45度,Vision API始终找不到任何东西。是否有其他用于iOS的API可以帮助我完成此任务?
浏览 25
提问于2020-03-11
得票数 0
1
回答
OCR分析获取复选框或单选按钮值
、
、
、
我需要解析OCR图像文件并获取所有文本和复选框值,如何从OCR解析中获取复选框或单选按钮值,以及哪一个OCR Api给出了从图像中提取的校正结果。
浏览 3
提问于2014-03-01
得票数 2
2
回答
如何在C#中读取位图中的文本?
、
我正在创建一个严重依赖于图像识别的程序。我通过截图来实现这一点,然后确定在截图的位置是否存在预先确定的图像。 然而,对于我的程序,我还需要能够拍摄一个位置的屏幕截图,其中将有文本,特别是数字。它将是常规的,使用相同的字体,但每次都是不同的数字。 如何将位图中的此类信息转换为可在代码中使用的整数? 谢谢。
浏览 0
提问于2014-05-30
得票数 0
1
回答
如何在安卓演播室中导入opeCV的tesseract
、
、
我使用openCV 3.2。现在,我想在android中导入模块tesseract。你能帮帮我吗?
浏览 4
提问于2017-04-20
得票数 0
回答已采纳
2
回答
如何在android中获取图片上方的文本?
、
、
我有一张上面有文字的图片。我需要从图像中提取文本。 例如:假设我有一个图像,在图像的顶部,我有一个标志"NOKIA“。我想从图像中提取徽标作为文本。
浏览 6
提问于2013-03-11
得票数 0
2
回答
使用python / django进行复杂的图像分析
、
、
、
我正在做一个django项目,它分析包含文本的图像,(1)推断图像是否需要旋转,(2)文本区域在哪里。 我目前正在使用PIL对这些图像进行一些更简单的处理,但我不太确定如何使用PIL或其他库来执行这两个任务。我想知道以前是否有人这样做过,是否有库/ api可以帮助开发。
浏览 0
提问于2011-06-26
得票数 4
回答已采纳
2
回答
使用tesseract或OpenCV实现安卓系统的目标检测
、
、
、
、
我已经成功地将tesseract集成到我的android应用程序中,它可以读取我捕获的任何图像,但准确率非常低。但大多数情况下,我在捕获后无法获得正确的文本,因为感兴趣区域周围的一些文本也会被捕获。 我只想准确地读取矩形区域中的所有文本,而不是捕捉矩形的边缘。我已经做了一些研究,并在stackoverflow上发布了两次,但仍然没有得到满意的结果! 下面是我写的两个帖子: 我不确定是继续使用tesseract还是使用openCV。
浏览 0
提问于2013-06-21
得票数 9
回答已采纳
1
回答
从图片python中识别明文
、
、
、
我用pytesseract从图像中识别文本 pytesseract.pytesseract.tesseract_cmd = r'C:\Program Files\Tesseract-OCR\tesseract.exe' 然后我使用下面的代码来识别文本 textImg = pytesseract.image_to_string(Image.open(imgLoc+"/"+imgName)) print(textImg) text_file = open(imgLoc+"/"+"oriText.txt", "w")
浏览 2
提问于2019-05-25
得票数 0
1
回答
如何用Autoit将图像识别为文本?
、
、
有没有用Autoit把图片识别成文本的工具? 我在屏幕上有固定的区域,其中一些文本显示为图像。我需要获取它的值并保存到文件中。 请不要通过比较像素颜色来做这件事。
浏览 0
提问于2013-08-29
得票数 1
回答已采纳
1
回答
双语图像(含文本)检测
、
、
我有几个包含文本的图像,我想在上面执行OCR,但问题是一些图像是双语的,包含英语和阿拉伯语文本,还有一些是纯英语。我怎样才能检测到这些双语页面?我只想要英文的OCR。
浏览 1
提问于2016-03-10
得票数 0
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
31个Python实战项目教你掌握图像处理,PDF开放下载
利用Python和OpenCV实现将图像识别为Excel表格的便捷方法
中关村科金OCR技术:文字识别领域的“智能眼睛”,洞察一切文档细节
图片转excel表格原理深入探讨
利用Python检测网页文本内容并标定屏幕坐标
热门
标签
更多标签
云服务器
ICP备案
实时音视频
对象存储
即时通信 IM
活动推荐
运营活动
广告
关闭
领券