腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
视频
沙龙
1
回答
如何使keras默认模型只识别数字?
、
、
、
我使用python和keras ocr。我希望角星只识别数字,所以在管道中我这样做。 recognizer = keras_ocr.recognition.Recognizer(alphabet="0123456789") pipeline = keras_ocr.pipeline.Pipeline(recognizer=recognizer) 但是,它并没有像tesseract白名单那样将字母转换为数字和提高识别质量,而是发生了。 所以这些数字根本认不出来。 使用默认字母表,结果会更好。但是有些数字和字母混淆了。然而,将字母改为数字,如“替换(”O“,”0“)是一个非
浏览 25
提问于2022-05-30
得票数 3
1
回答
一种用于模因图像的OCR字体
、
我正在为网络模因图像编码一个特殊的光学字符识别。这是一个学校项目,应该用C语言编码。 目前,我在编写OCR代码的方法/算法上遇到了问题。事实上,几乎所有的模因图像都有相同的字体,这是影响(更不用说其他没有影响字体)。OCR的目标将是检测和识别字符,这些字符在影响字体,在模因图像的前景,而不是在它背后的场景。 要做这个OCR,我的意思是神经网络有点过火,因为模因图像中的字符是简单的、直接的和向前的。我听说有其他“更简单”的方法来做OCR,比如使用机器学习算法来“学习”影响字体,或者使用基于骨架匹配的系统通过模式识别来识别字符。 做OCR最好的方法是什么?而是神经网络?模式识别?机器学习?
浏览 0
提问于2016-03-28
得票数 1
回答已采纳
2
回答
Tesseract: RetriveResultDetail-方法总是返回null
、
、
、
我想用.Net中的Tesseract OCR引擎做一个光学字符识别。因此,我使用了tesseractdotnet-Wrapper 。我需要获取每个识别单词的单词位置(RetriveResultDetail-Method): TesseractProcessor ocr = new TesseractProcessor(); ocr.Init(executionPath, "eng", 3); Image image = Image.FromFile(imagePath); Console.WriteLine(ocr.Apply(image)); List<tesserac
浏览 0
提问于2013-06-03
得票数 0
回答已采纳
1
回答
使用Tesseract-OCR进行图像到文本的识别比使用我的Python代码手工预处理图像更好
、
、
、
、
我试图用Python编写代码,用于使用Tesseract-OCR进行手动图像预处理和识别。 手册过程: 为了手动识别单个图像的文本,我使用Gimp对图像进行预处理,并创建一个TIF图像。然后我把它喂给Tesseract-OCR,它正确地识别了它。 用Gimp对图像进行预处理- 将模式更改为RGB /灰度 菜单--图像--模式- RGB 脱粒 菜单--工具--彩色工具--阈值--自动 将模式更改为索引 菜单--图像--模式-索引 调整大小/比例至宽度>300 to 菜单--图像--缩放图像-- Width=300 保存为Tif 然后我给它喂食- $ tesser
浏览 3
提问于2015-09-09
得票数 6
1
回答
Tesseract OCR力模式
、
、
我想用Tesseract阅读一个特定的字符序列,如下所示: 我在Tesseract中尝试过匹配模式,\d\d\d\A\A和OCR仍然识别不匹配的其他单词。 我试过使用"tessedit_char_whitelist“参数,但无法选择字符的位置。 我启动命令:tesseract image.jpg result -l eng bazaar和我有这样的消息: 请在模式开头至少提供4个具体字符,无效用户模式\A\A\d\d\d Tesseract开放源码OCR v3.01和Leptonica image.jpg: 结果: AB123 ABC12
浏览 10
提问于2015-08-07
得票数 9
1
回答
用预定义的字体图像训练"tesseract ocr“
、
、
、
、
我试图使OCR从图像中识别ASCII字符串。我正在使用Tesseract3库,但是在正确识别方面我有一点问题,所以我需要用新的字符集(这是特定的)来训练它。我已经发现了这个如何:,但是由于图像测试集的简单性,本教程有一些我不需要的不必要的过程。我的图像数据集只包含1行,其中每个ASCII字符在所有图像中都是相同的(没有旋转,没有缩放),但是在行中的字符之间有可变的距离(仅为水平的)。 如何使用字体图像来训练识别算法?
浏览 2
提问于2014-06-05
得票数 4
1
回答
你能用MODI识别非语言特定的项目吗?
、
、
我让文档OCR在图像上工作,当页面上有“咖啡”或"432“这样的单词时,工作正常,但是当我尝试使用诸如"abc123”这样的单词时,我会得到一个"OCR运行错误“。 MODI.Document md = new MODI.Document(); md.Create("c:\\temp\\mpk.tiff"); md.OCR(MODI.MiLANGUAGES.miLANG_ENGLISH, true, true); // <-- Error thrown here MODI.Image image = (MODI.Image)md.Images
浏览 1
提问于2011-03-05
得票数 0
回答已采纳
1
回答
有没有办法避免不必要的文本从车牌?
、
、
、
我是刚开始车牌识别的。我使用Goggle的视觉API(OCR)从图像中提取文本。但是这会从车牌上提取出所有的文本。例如,考虑下面的图像 我只需要得到牌照号码6TRJ 244,但我可以从车牌上得到所有像california AUF 2012dmv.ca.gov这样的文本。 有人能指导我如何避免其他文本而只提取许可证号码吗?请分享任何其他方法的车牌识别,我也可以尝试。谢谢
浏览 6
提问于2020-06-14
得票数 0
1
回答
pyTesseract识别文本模式
、
、
我想做一个简单的车牌识别器。目前,我的问题来自于Tesseract扰乱了一些读数(例如,5作为S)。我知道图像总是三个大写字符,后面跟着三个数字,以AAA 999左右的形式出现。有什么办法让我把这个信息给OCR吗?
浏览 6
提问于2022-11-27
得票数 0
回答已采纳
1
回答
Java -通过图像识别一个字符
、
、
、
我试图使用Ocr框架来识别这些类型的图像:这些是两个字母G。 我试过使用aocr.jar,但这段代码似乎做不到。 import com.asprise.ocr.Ocr; import java.io.File; public class textRecognizer { public static void main(String args[]){ Ocr.setUp(); Ocr ocr = new Ocr(); ocr.startEngine("eng", Ocr.SPEED_FAST);
浏览 2
提问于2014-09-09
得票数 2
1
回答
使信的边缘变薄,使之只保留OCR的信的中心
、
、
、
我正在努力提高复杂字母的识别率,例如日文/中文字母。 应该做什么样的图像处理才能使字母在左手边使字母在右边? 这样的想法是保持字母的中心位置(我不知道如何称呼它),使字母变得更脆,因此OCR (如Tesseract)的识别率将得到提高。 如果有另一种方法来提高这样复杂的字母的识别率,那就很高兴知道了。
浏览 4
提问于2016-11-29
得票数 1
回答已采纳
3
回答
图像文本识别
、
、
想象一下这样一个短片:黑色背景,中间的一行白色文字逐渐被红色填充,不仅是一个字母,而且每个单独的字母都是逐渐填充的。下面是一个简化的图像,它说明了这一点: (中间有很多帧,但为了简单起见,它们被省略了。) 因此,经过一段时间(大约10秒),整个字符串将是红色的。 现在我要解决的任务是: 我必须识别初始字符串,因此我应该得到"HELLO“作为结果。 不仅如此。对于每一封信,我都要找出它在哪一点上星星被填满了,在什么时候它被完全填满了。 输出可能如下所示: H,0ms,1000ms E,1000ms, 1500ms L,1500,2500ms L,2500ms,3
浏览 2
提问于2014-08-16
得票数 0
1
回答
如何替换特定格式单词中的歧义字符
、
、
我使用tesseract OCR从不同的文档中提取一些文本,然后使用Regex处理提取的文本,以查看它是否与特定的模式匹配。不幸的是,OCR提取在有歧义的字符上会出现常见错误,例如: 5: S、1: I、0: O、2: Z、4: A、8: B等。这些错误是如此常见,以至于替换模糊的字符将与模式完美匹配。 有没有一种方法可以通过遵循特定的模式来后处理OCR提取和替换歧义字符(预先提供)? 预期输出(以及我到目前为止所能想到的): # example: I am extracting car plate numbers that always follow patern [A-Z]{2}\d{5
浏览 22
提问于2021-02-01
得票数 1
回答已采纳
1
回答
使用斯坦福分类器进行字符识别
、
、
我正在开发一个与OCR相关的android应用程序,我需要使用多元逻辑回归对字母表进行分类。我的问题是,我可以使用斯坦福分类器()进行字符识别吗?如果它可以在图像数据集上进行训练?如果我不能,请为我推荐一个JAVA库。
浏览 4
提问于2015-10-13
得票数 0
2
回答
黑名单字符不会被Tesseract OCR忽略
、
、
我使用Tessearct来识别图像的字符。但我希望OCR忽略数字字符。 _tesseract->SetVariable("tessedit_char_blacklist", "0123456789"); 通过这种方式,OCR不识别数字字符,但它为我提供了一些我不想要的其他字符。 例如:有一个图像的文本为$ 12,当我在该图像上应用OCR时,它提供了美元fl。 如上文所示,OCR将12转换为fl,这是我不想要的。我希望12被OCR忽略。 有没有办法得到美元而不是美元fl的结果? 给我任何解决办法。任何帮助都是有价值的。
浏览 2
提问于2013-03-04
得票数 3
回答已采纳
1
回答
如何在Firebase Google cloud OCR文本识别中检测人民币符号?
、
我正在使用Firebase Google云文本识别OCR。我在扫描文本和货币。在这种情况下,我可以很容易地扫描文本,但是,一些符号,如日元,元是没有检测到的。 我正在使用应用程序中的firebase google cloud ocr API服务扫描文本。
浏览 2
提问于2019-06-07
得票数 0
1
回答
Java simple OCR算法
、
、
我已经在做一个简单的OCR项目好几天了。该应用程序被认为是从图像中提取文本。我想出的解决方案是:灰度化,旋转,去除图像中的噪声,并隔离图像上的每个字符。所以我需要一个简单的算法来帮助我识别这个字符。我只需要识别字母A,B,C,D。
浏览 1
提问于2015-07-02
得票数 0
1
回答
Pytesseract无法识别它是否只是一个字母
、
、
、
我只需要识别一个字母 但是当它仅仅是一个字母时,OCR无法识别! 在这种情况下,我试图识别字母H,但什么也没有出现!!我要怎么做才能让他认出来? from PIL import Image from pytesseract import * import cv2 img = cv2.imread('H.png',0) edges = cv2.Canny(img,100,200) img_new = Image.fromarray(edges) text = pytesseract.image_to_string(img_new, lang='eng') pri
浏览 45
提问于2019-01-10
得票数 3
回答已采纳
3
回答
如何提高文本识别usingTesseract OCR。?
、
、
、
我在I中实现了文本识别的tesseract ocr,对输入图像进行了预处理,给出了Tesseract method.It,识别效果较差。 步骤: 1.侵蚀功能 2.扩张功能 3.Bitwise_not函数 Mat MCRregion; cv::dilate ( MCRregion, MCRregion, 24); cv::erode ( MCRregion, MCRregion, 24); cv::bitwise_not(MCRregion, MCRregion); UIImage * croppedMCRregion = [self UIImageFromCVMat:MCRreg
浏览 1
提问于2014-08-28
得票数 4
1
回答
OCR符号与非符号检测/识别
、
、
在OCR应用程序中,您通常会找到图像的连接组件,并在这些组件上运行OCR引擎以识别它们。 我的问题是,如果您连接的组件具有训练集中不存在的符号/形状,应该怎么办。 例如,如果我们正在运行数字识别,而图像有一条直线或一个字符,那么就说"X“或任何不是数字的东西。 你怎么知道它不是一个数字呢?
浏览 1
提问于2011-02-06
得票数 0
2
回答
如何使用Python进行新加坡车牌识别的校验和
、
我能够对车牌进行识别,并提取车牌的值。有时,当我使用OCR进行识别时,结果不准确。我使用校验和来确保只打印和查看正确的结果。在计算完校验和之后,我需要使用另一个公式来得到车牌的最后一个字母。匹配这19个字母,A=0,Z=1,Y=2,X=3,U=4,T=5,S=6,R=7,P=8,M=9,L=10,K=11,J=12,H=13,G=14,E=15,D=16,C=17,B=18。有没有什么方法可以用循环来声明这些字母的值,而不是手动逐个声明?请帮帮忙。谢谢。
浏览 0
提问于2020-08-03
得票数 0
2
回答
OCR -大多数“不同的”或“可识别的”ASCII字符?
、
、
、
我正在寻找一种方法来确定最“不同”或“可识别”的N个ASCII字符...例如,如果N= 10,从0x21到0x7E的ASCII集合中最不同的N个字符是什么?显然,字符"X“与"O”(字母)非常不同,但"O“(字母)与"0”(零)非常相似。假设一个受限的OCR字符子集,这样0和字母O将被检测为一个或另一个,并且不必担心它是零还是字母O,那么典型的OCR引擎(例如Tesseract)很容易从质量较差的输入图像中识别出的最不同的N个字符是什么?假设。例如"+“和"t”会被广泛地误认为是另一个。因此,每个输入字符,无论是"+“还是"t”,
浏览 0
提问于2009-09-11
得票数 1
回答已采纳
1
回答
视频中的OCR?openCV或使用光学字符识别的图像处理?
、
、
我必须写一个程序,从司机前面的车内屏幕上拍摄的视频中进行OCR,所以它只对数字进行OCR。我正在努力寻找实现它的方法。我正在考虑使用openCV,但作为另一种选择,我正在考虑使用一个从视频中提取帧并找到数字的光学字符识别程序。但是许多OCR程序不能正确识别数字(也许OCR需要训练?)。所以我想使用计算机视觉库来完成这项工作。 你认为实现这个简单程序的最好方法是什么? 我认为使用计算机视觉库和匹配的模板会很好,但也可以帮助me.for例如有程序做车牌识别。 所以任何建议都是受欢迎的。
浏览 6
提问于2012-06-30
得票数 5
回答已采纳
1
回答
Tesseract带有文本识别的简单图像,想要转换/转换图像的帮助
、
、
、
、
你好,我正在尝试使用OCR tesseract来识别图像中的一些字母。 我用imagemagick做了一个转换,图像看起来不错,但还不够 原始图像: 与imagemagick一起使用的命令 convert input.jpg -fuzz 50% -fill black -opaque black -bordercolor white -border 2 -fill black -draw "color 0,0 floodfill" -alpha off -negate -units pixelsperinch -density 72 output.jpg 结果图像:
浏览 6
提问于2017-07-05
得票数 1
2
回答
如何识别图像中的字母?(在OCRing之前)
、
、
我在网上能找到的都是关于OCR的,但我还没有找到,我仍然需要识别图像中字母的位置。 任何帮助我们都将不胜感激。
浏览 1
提问于2011-02-04
得票数 1
回答已采纳
1
回答
Tesseract OCR音高文本
、
、
当涉及到光学字符识别软件,特别是Tesseract OCR引擎时,我有一个关于术语的问题。 我正在读一篇关于Tesseract OCR引擎的文章,它经常提到一些叫做Fixed pitch text的东西,我不完全确定这意味着什么。我假设音高是一行文字占据的空间,但在我正在阅读的文章的上下文中,这是没有意义的。 这是该条中使用这一措辞的一句话: 小块被组织成文本行,并对固定音高或比例文本的线条和区域进行分析。 我已经在网上查找过这方面的一些定义,但是大多数关于OCR的文章都是在没有解释的情况下使用的。我猜这意味着这是一个相当简单的/常见的术语。 如果有人关心的话,我正在读的这篇文章叫做“Tes
浏览 2
提问于2020-03-18
得票数 0
2
回答
我怎样才能让Tesseract OCR识别电能表的大位数字?
、
我想使用RPi上的OCR程序来识别我的电表照片中的数字。这些数字很大,对我来说很明显,但Tesseract似乎根本认不出它们--充其量它能检测到一些随机错误的数字。 我已经尝试过剪切这些数字,并分别对它们进行OCRing,但这并没有帮助。我试过其他几个OCR程序,它们也没有更好。 请你给我一些建议,我怎样才能让Tesseract正确地识别出下图中的两个大数字?请注意,这是原始图片是~2.5MB -这个副本更小,以适应这个网站。 📷
浏览 0
提问于2017-08-07
得票数 0
1
回答
如何构建OCR培训数据集?
、
、
、
为了具体起见:让我们假设" OCR“一词是指建立在R架构上的任何OCR系统。同样,为了简单起见,让我们声明我们对读取0到100之间的数字感兴趣。 问题:我应该如何构建数据集(考虑到上述目标和体系结构)? 我的理解是,我需要收集从1到100的所有数字的图像,并用相应的数字标记它们。这个前提对吗? 我的奋斗之处在于,我无法完全理解这个看似单调乏味的过程是如何推广到读取更一般类型字符(例如语言-字符)的OCR中的,或者如果我概括这个问题以检测从0到10^{10}的数字)。 提前感谢!
浏览 0
提问于2022-10-26
得票数 1
1
回答
我可以使用哪些方法在不使用OCR的情况下识别字符/字母?
、
、
、
、
我想知道是否有一些方法可以在不使用OCR的情况下识别字母(我的情况简单一点,我只需要识别大写字母)。 目前,我的应用程序可以生成每个字符的二进制版本,由于图像的分辨率不高,所以不是很精确,但对大多数图像都很好。所以我需要一个计算快速可靠的算法来识别它。 我该怎么做呢?
浏览 0
提问于2013-05-04
得票数 0
回答已采纳
1
回答
大写字母常见的OCR错误是什么?
、
大写字母的OCR (光学字符识别)中常见的错误是什么? 例如,对于->离岸价
浏览 2
提问于2011-11-27
得票数 3
回答已采纳
5
回答
是否有OCR无法识别的字体?
我正在试着写一个只能被人读懂的文档。无法复制文档内容。为此,我将其页面转换为图片,并将其添加回PDF文件。主要的问题是,任何OCR程序都可以恢复整个书面文本,特别是页面将是清晰的(而不是扫描的书),这将提高OCR的准确性。 那么,有没有OCR无法识别的字体呢?否则,有没有一种技术可以让我的文档只被人类阅读,而不被OCR识别?(例如,添加特定的背景,等等) 提前谢谢你。
浏览 3
提问于2012-11-13
得票数 4
回答已采纳
1
回答
混合语言OCR
、
、
、
、
我在解决一个表格数据识别任务 最大的问题是混合语言图片的识别。 我正在为OCR使用tesseract,但是它不能同时识别两种语言。 以下是输出的示例: 📷 如果我用'eng+rus‘作为lang选项,它就不能识别英语,所以我的问题是:有办法同时识别这两种语言吗?所以输出看起来应该是: KitchenAidХолодильникKCFMA 60150 R
浏览 0
提问于2022-07-19
得票数 2
1
回答
如何从Tyre这样的背景和文本颜色相似的图像中检测文本?
、
、
、
、
我正在尝试从轮胎图像中提取文本,因为背景和前景文本是相似的,大多数OCR (尝试谷歌OCR和tesseract)都无法检测到文本。你们能建议一些预处理步骤来提高OCR效率吗 示例图像- 我已经尝试了阈值和边缘检测这些文本-我没有得到适当的输出阈值,但获得了一些领先的边缘检测- 以下是使用OpenCV的的结果-
浏览 0
提问于2019-11-05
得票数 5
3
回答
关于OCR 运单识别方案疑问?
想利用OCR中的运单识别方案运用在教育层面,如果图片并非运单样式,而只是普通纸张的手写图片是否可识别,包括中英文、数字、符号。
浏览 494
提问于2018-03-01
4
回答
改进图片以检测区域内的字符
、
、
、
我的目标是检测这类图像上的字符。 我需要对图像进行改进,以便Tesseract能够更好地识别,可能需要执行以下步骤: 旋转图像,以便蓝色矩形是水平的,在这方面需要帮助。 根据蓝色矩形裁剪图像需要帮助 应用阈值滤波和高斯模糊 使用Tesseract检测字符 img = Image.open('grid.jpg')图像= np.array(img.convert("RGB")):,:,:1.复制()#需要在这里旋转图像并填充空白#需要在这里裁剪图像# gray =cv2.cvtColor(图像,cv2.COLOR_BGR2GRAY) # Ots
浏览 0
提问于2018-09-24
得票数 3
回答已采纳
1
回答
Kofax捕获识别-I与1
、
、
使用Kofax Capture 10 (SP1,FP2),我在文档的某些字段上设置了识别区。这些字段始终将I识别为1。我尝试了所有我能想到的不会清除字段中所有字符的设置组合,但都无济于事。我已经尝试了高级OCR和高性能OCR,不同的字符过滤器。各种各样的东西。 我可以尝试哪些选项来自动识别此字符?我应该告诉制作表单的人(它们是由计算机生成的)他们需要尝试使用不同的字体吗?让他们相信现在是时候考虑使用验证了吗? 我当前的字段设置: Kofax高级OCR,除了在高级对话框中最大限度地提高精确度外,没有自定义设置。到目前为止,这个方法和我尝试过的其他方法一样有效。 使用的字体是8- 12磅,顺便说一
浏览 2
提问于2012-12-13
得票数 3
回答已采纳
3
回答
Vuforia文本识别与OCR的区别?
、
、
、
、
谁能告诉我Vuforia文本识别和OCR的区别是什么?是一样的吗?我有点困惑,因为我发现Vuforia不需要捕获任何图像就可以识别文本,而OCR应用程序(如Tesseract )则要求用户捕获文本,图像识别文本。 谢谢。
浏览 1
提问于2013-11-03
得票数 1
回答已采纳
1
回答
计算器数字识别
、
、
我必须在记分板、计算器和类似的设备显示器上识别一组数字。 我在大多数流行的ocr中尝试了这个图像,但都没有成功。 如何对此图像进行预处理以使其与ocr框架一起工作?如何从那里获取这些数字?
浏览 0
提问于2013-07-04
得票数 0
1
回答
Windows OCR引擎无法识别画布(转换为位图)中的文本
、
、
、
、
我有一个cordova项目,在那里我有一个"scribble pad“,用户可以在那里涂鸦他们的笔记。这是一个简单的画布对象,我想让将其转换为文本。我正在努力将画布数据转换成OCR引擎支持的软件位图。 所有样本都基于从存储中加载文件或从摄像头读取流。我是否必须将此画布保存到设备上的文件中,并将其读回流中? 我很欢迎这里的指导,因为图像是我努力解决的问题。 更新 因此,我设法获得了流,但不幸的是,OCR无法识别它。 我有画布对象,在页面加载后,我将文本放入其中,因此任何有能力的OCR都应该能够读取它。我还有"img“元素,用于检查流是否正确以及是否包含正确的位图。下面是将conv
浏览 0
提问于2016-03-12
得票数 0
3
回答
通过简单的训练进行手写识别
、
我一直在阅读(并尝试)前面的答案中建议的OCR程序,但我仍然没有一个明确的答案。 我需要识别手写的英文文本。文本应该是多行的,但每行只有一个或两个单词的长度。文本来自不同的人在时间。我可以要求那个人提供一份培训文件(例如,字母表和0-9数字),但我不能要求比这更复杂的培训。 我需要将识别作为另一个( Java )应用程序的一部分集成,但解决方案不需要是Java。我可以在Java中执行它,然后从一个文本文件中获得结果。 有什么建议吗? 我已经测试过Tesseract (没有经过训练的糟糕结果,而且训练看起来相当复杂)。Java OCR看起来像是完美的解决方案(简单的培训、开源和Java),但即使
浏览 3
提问于2011-05-26
得票数 2
回答已采纳
1
回答
获取在c#的winform应用程序中进行光学字符识别时提取的第一个字母表的坐标
、
、
有没有办法或任何动态链接库,使我可以获得的位置或坐标的第一个字母或字母表找到使用光学字符识别在windows窗体应用程序C#而不是执行光学字符识别整个文件? 因为我已经使用Aspose和tesseract Dll在image.it上执行OCR,所以提取文本需要时间,因为它读取所有文本,但我只想读取第一个单词并获取提取的第一个字母的坐标。我必须使用C#在windows窗体应用程序中实现它。请帮帮忙。提前谢谢。!
浏览 4
提问于2018-06-12
得票数 3
1
回答
如何使用opencv正确地重定向单字符图像
、
、
、
、
如何正确定位这些从无人机上拍摄的字母图像。我试过opencv中的拟合椭圆函数,但它有时会以错误的方式拟合椭圆,导致字母以错误的方式旋转。 Cv2.fit椭圆给出了椭圆的主轴与y轴的夹角(逆时针方向)。我将图像逆时针旋转180度,以重定向,即使椭圆垂直/平行于y轴。 我之所以这样做,是因为tesseract ocr不能正确识别像这样的迷失方向的字母,即使在它的"psm 10“模式下也是如此,这意味着要进行单字符识别。任何关于如何重定向这些字母的建议,或者如何让tesseract处理迷失方向的字母都会有很大的帮助!
浏览 2
提问于2018-01-26
得票数 3
1
回答
在Tesseract培训中将字符添加到现有字体中
、
有没有一种方法可以将字符添加到现有的字体中,该字体是为Tesseract OCR训练的? 我刚训练了一种新字体,但它把冒号(':')误读为‘2’ 所以,我想把它训练成识别结肠,而不需要重新训练我刚刚训练过的所有东西。这有可能吗?
浏览 3
提问于2016-03-18
得票数 2
回答已采纳
3
回答
C#中的图像处理--一个聪明的解决方案?
、
、
我有一个带有字母的图像,字母有两种颜色,黑色和蓝色,我想从图像中读取蓝色的字母。 有没有人能给我一个用C#实现这个功能的方法?我正在学习GDI+,但仍然没有得到任何逻辑来开发这个程序.. 我试过OCRing它,但常见的OCR的问题是他们不能识别颜色差异。 我只想读蓝色字符.... 任何指导都是非常感谢的。
浏览 1
提问于2009-08-15
得票数 4
回答已采纳
2
回答
如何识别这些图像中字母的颜色?
、
、
、
我正在使用来解决验证码问题。它的工作原理是使用AForge从图像中删除背景,然后将Tesseract OCR应用于结果清理后的图像。 问题是,它目前依赖于字母是黑色的,因为每个验证码都有不同的文本颜色,所以我需要将颜色传递给图像清理器,或者将字母的颜色更改为黑色。要做任何一个,我需要知道字母的现有颜色是什么。 我该如何识别字母的颜色呢?
浏览 14
提问于2017-01-19
得票数 3
回答已采纳
1
回答
包含Tesseract的特殊字符白名单(OCR)
、
、
、
、
我正在尝试通过OCR读出一些货币价值,问题是我想告诉他应该识别哪些字符。 这是我当前的白名单 Version : Tesseract from Charles Weld v3.0.2 tessedit_char_whitelist "0123456789,.$" 如何包含分号(1)? 更新1:如果我添加到列表中,它将无法识别它。
浏览 35
提问于2017-08-11
得票数 2
回答已采纳
4
回答
使tesseract只能识别数字
、
、
我正在尝试改进我制作的OCR程序,以读取我正在使用的某个图像的布局。现在,我希望我的OCR程序只能识别数字0-9。 我试着遵循问题的解决方案: 但是我陷入了必须调用tesseract的部分: tesseract input.tif output nobatch letters 这是怎么回事?
浏览 2
提问于2012-07-03
得票数 9
回答已采纳
1
回答
如何解决中的字母混淆问题?
、
、
我试图提取带有OCR和regex的增值税发票号,但很多时候字母B与数字8混淆了。例如,增值税号码是B28125185,OCR返回828125185。当然,regex没有检测到增值税的数量。我读过一些关于Levenshtein距离的文章,但我不知道如何实现它。有办法解决这个问题吗? 谢谢
浏览 1
提问于2020-06-10
得票数 0
2
回答
如何将带圈的数字转换为数字?(1到1)
、
、
、
、
我想转换数字从我收到的字符串后,OCR识别的日语文本。 例如,当我提取日期时: ③① 年 ⑫ 月 ①③ 日 我想将其转换为: 31 年 12 月 13 日 实现这一目标的最佳方式是什么?
浏览 54
提问于2019-02-21
得票数 5
回答已采纳
2
回答
Google Books如何找到文本区域?
、
计算机视觉中一个具有挑战性的主题是处理文档扫描。通常,这涉及许多步骤,如噪声去除、颜色分析、二值化、文本块识别、OCR,然后可能还会进行一些上下文分析和校正。 我很好奇,有没有人能理解,知道或者能告诉我Google在OCR阶段之前是如何识别文本块的。有什么见解吗?
浏览 2
提问于2009-01-15
得票数 4
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
字符图像识别——数字字母混合
OCR识别软件,有什么可以ocr识别的软件
医疗票据ocr识别,医疗检验报告单OCR,医疗票据识别企业,医疗单据ocr识别_快瞳科技
ocr识别软件怎么样识别营业执照/营业执照ocr识别?
OCR-文字识别
热门
标签
更多标签
云服务器
ICP备案
对象存储
实时音视频
云直播
活动推荐
运营活动
广告
关闭
领券