我正在为网络模因图像编码一个特殊的光学字符识别。这是一个学校项目,应该用C语言编码。
目前,我在编写OCR代码的方法/算法上遇到了问题。事实上,几乎所有的模因图像都有相同的字体,这是影响(更不用说其他没有影响字体)。OCR的目标将是检测和识别字符,这些字符在影响字体,在模因图像的前景,而不是在它背后的场景。
要做这个OCR,我的意思是神经网络有点过火,因为模因图像中的字符是简单的、直接的和向前的。我听说有其他“更简单”的方法来做OCR,比如使用机器学习算法来“学习”影响字体,或者使用基于骨架匹配的系统通过模式识别来识别字符。
做OCR最好的方法是什么?而是神经网络?模式识别?机器学习?
发布于 2016-03-28 16:12:18
一旦你确定了包围框,你很可能可以通过渲染最常见的字符(例如,可打印的ASCII)并查看差异来对大多数字符进行蛮力识别。
我仍然怀疑,一个非常简单的神经网络可以做得更快,如果你用相对较大的怀疑字母块(例如,一个8×10矩阵,甚至更粗),任何彩色的内容都会被一种颜色删除/替换,因为备忘录字母通常是白色的,带有黑色的边框。不过,这个网络需要接受培训。
https://softwareengineering.stackexchange.com/questions/314058
复制相似问题