我正在尝试开发一个算法来阅读草书笔迹(准确地说是医生的笔迹)。我不需要匹配每个字母,只需要匹配可识别的字母(我使用字典方法)。
现在,我将二进制化的图像放在BufferedImage类中。我下一步需要做的是隔离每个字符。
你能为我提供一个伪代码,告诉我如何实现这一点吗?我希望在使用其他库时尽量少用。我想通过了解每个过程是如何实现的来做到这一点。有什么提示吗?
发布于 2012-07-08 14:01:35
您将需要了解Image Moments等可用于比较图像的内容,即使图像已经过旋转或缩放
你需要深厚的数学背景才能理解如何做到这一点,你可以从阅读这篇http://www.ias.ac.in/sadhana/Pdf2007Oct/521开始,它是关于如何实现一种特殊类型的字符(汉字)的光学字符识别,同样的一般原则也应该适用于你正在尝试做的事情
除非你愿意花几个月(或几年)来追求这个目标,否则我建议你使用已经可用的东西,比如ocropus或javaocr
发布于 2012-07-09 09:20:32
或者,您可以从Vision Objects购买HWR SDK,这将大大减少您的开发工作量。
https://stackoverflow.com/questions/11380926
复制相似问题