机器视觉知识-手写字体竟然是这样识别的?

OCR简称Optical Character Recognition,它是指对于纸上的打印的文字字符进行识别,将识别结果以文本方式存储在计算机器中。根据识别的字符类型通常可分为印刷体识别和手写体识别两大类。

字符识别原理:通过对特征点形状的提取,分离器分离字符,然后进行文本的输出。

我们以手写字体为例进行讲解,识别的步骤如下:

1.打开机器视觉软件。

2.采集图像。点击软件界面“工具箱”-->“图像处理”-->“采集图像”,将采集图像工具拖至流程栏,如图一所示。采集图像的方式有文件、目录、相机三种方式,我们选择“文件”下采集,如图二所示。在电脑的文件夹中,选择格式为JPG或BMP格式的图片。

图一

图二

3.字符识别工具添加。添加“字符读取”和“字符集合”工具至流程栏,如图三所示

字符读取:用于读取字符文本,需要将标准的字符录入字符集合中。

字符集合:配合“字符读取”工具使用,用于存储字库模板。

图三

4.选择输入图像。点击流程栏的“字符读取”,选择输入的图像为“Task.1采集图像”。如图四所示。

图四

5.设置检测区域。在区域设置中,选择矩形方框,拖动到检测的字符区域,如图五所示。

图五

6.衔接“字符集合”,参数设置。进行分割参数设置(阈值、字符极性、字符宽度、字符 高度)和识别参数设置(最小分数设置)。如图六所示。

图六

通过调整参数来达到将字符逐个分割,如图七所示。

图七

7.学习字符。如图八所示,选择单个学习或全部学习,如图久所示,将图像中的字符逐个输入在学习字符的对话框内,然后“执行”。

图八

图九

8.结果显示。将“系统工具”下的“数据显示”,将拖至流程栏,点击“数据显示”,添加数据文本为“字符读取”的文本,点击确定。

图十

最终的识别结果如下图所示。

以上为手写字符识别的全部过程,由于手写字体具有随机性、自由化程度高,识别起来比印刷字符困难,因此需要大量的学习才能达到快速正确的识别。

总结:

字符识别流程如下图所示

想了解更多的机器视觉知识,欢迎关注我们的公众号,后续会定期的更新内容。

关于文章中所使用的视觉识别软件,可以撩我们的客服小姐姐获取

还不快来撩我,获取机器视觉资料!!!

End

  • 发表于:
  • 原文链接:https://kuaibao.qq.com/s/20180706G0PEVR00?refer=cp_1026
  • 腾讯「云+社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。

扫码关注云+社区

领取腾讯云代金券