前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >Windows 10 IoT Serials 10 – 如何使用OCR引擎进行文字识别

Windows 10 IoT Serials 10 – 如何使用OCR引擎进行文字识别

作者头像
ShiJiong
发布2018-03-27 17:16:53
2.6K0
发布2018-03-27 17:16:53
举报

1. 引言   

    OCR (Optical Character Recognition,光学字符识别)是指电子设备(例如扫描仪或数码相机)检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程;即,针对印刷体字符,采用光学的方式将纸质文档中的文字转换成为黑白点阵的图像文件,并通过识别软件将图像中的文字转换成文本格式,供文字处理软件进一步编辑加工的技术。

    在Windows 10通用应用程序UWP示例中,包含了OCR应用程序,具体请参考(https://github.com/Microsoft/Windows-universal-samples/tree/master/Samples/OCR),利用该应用程序,用户可以完成以下功能:

    1. 检测当前设备支持的OCR语言

    2. 获取当前设备可用的OCR语言

    3. 创建针对某种语言的OCR识别实例

    4. 加载图片,识别图片中的文字

    5. 从摄像头捕捉的图片中识别文字

    6. 将识别的文字覆盖在图片上

2. 问题

    该通用应用程序在PC平台上运行,没有出现问题。但是部署到Windows 10 IoT Core设备以后,会出现如下错误:“No available OCR languages.” 、”English is not supported”,如下图所示。

3. 解决方法

    上述问题的出现,是由于Windows 10 IoT Core设备上没有OCR的相关资源,导致程序无法正常运行。解决方法如下:

    首先,将Windows 10设备的C:\\Windows\OCR目录拷贝到Windows 10 IoT Core设备的c$\Windows目录,如下图所示。

1
1

    接着,将C:\Windows\System32\CatRoot\{*****} 中的 Microsoft-Windows-LanguageFeatures-OCR-en-us-Package... .cat文件拷贝到Windows 10 IoT Core设备的c$:\Windows\System32\CatRoot\{*****}目录,如下图所示。

2
2

4. 调试

    本次调试在MBM板子上进行,Windows 10 IoT Core设备的OS版本号为v.10.0.16299.192,采用的摄像头为微软LifeCam HD-3000

    首先,调试OCR图片中文识别,结果如下:

file-chinese
file-chinese

    可以看到,中文的识别准确度挺高,基本上都识别出来了。

    接着,在调试用摄像头进行OCR中文识别和OCR英文识别,结果分别如下图所示。

camera-chinese
camera-chinese
camera-english
camera-english

    从图中可以看出,摄像头识别的结果依赖于光线、摄像头分辨率等因素,环境光越好,摄像头分辨率越高,则识别精度就越高。

本文参与 腾讯云自媒体分享计划,分享自作者个人站点/博客。
如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 1. 引言   
  • 2. 问题
  • 3. 解决方法
  • 4. 调试
相关产品与服务
通用文字识别
通用文字识别(General Optical Character Recognition,General OCR)基于行业前沿的深度学习技术,提供通用印刷体识别、通用印刷体识别(高精度版)、通用手写体识别、英文识别等多种服务,支持将图片上的文字内容,智能识别为可编辑的文本,可应用于随手拍扫描、纸质文档电子化、电商广告审核等多种场景,大幅提升信息处理效率。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档