我正在为UWP开发,Windows有一个OCR引擎: Windows.Media.Ocr
我的问题是:有人知道Windows OCR是否可以接受识别新字符或使用自定义字体的培训?如果是的话,我怎么能做到?
我想要实现的是识别非字母符号。我想在每个例子中识别字符⌰(unicode: U+2316)或⌖(U+2316)。
我想识别的字符不是任何语言的符号。
发布于 2016-03-08 05:15:34
我在我的WUP应用中使用了WUP应用库,这里有一些不同字体的测试结果。
Arial
字体- Arial
测试词- Hello @ World
预期结果- Hello @ World
原始结果- Hello @ World
精度- 100%
代理FB
字体-代理FB
测试词- Hello @ World
预期结果- Hello @ World
原始结果- Hello
精度- 84.6% (遗漏-@符号和一个空格)
现代
字体-现代
测试词- Hello @ World
预期结果- Hello @ World
原始结果- Hello @ world
精度- 92.3% (W确认为w)
卢西达笔迹
字体- Lucida手写测试词- Hello @ World
预期结果- Hello @ World
原始结果- HeUe@ worw
精度- 46.1%
更新[1]
Arial Unicode MS
字体- Arial Unicode MS
测试符号-⌰⌖
预期结果-⌰⌖
原始结果-(无法识别)
精度- 0%
更新2
希望这对你有帮助。
发布于 2016-03-08 08:59:24
我认为对你问题的简短回答是否定的。正如在支持语言命名空间中的Windows.Media.Ocr节中所说的:
支持的语言有25种。根据识别的准确性和性能,支持的语言分为三类:
语言是正确的文本识别所必需的信息。每种语言都使用一些特定于语言的资源,因此必须事先指定.
只能使用安装在设备上的备注语言。用户可以通过设置应用程序安装新语言。
因此,如果您的符号不是任何语言,OCR引擎将不会识别它。
对于自定义字体,正如Vineet的答案所示,也许OCR引擎可以识别某些字体,文本识别的准确性取决于您的字体。如果是手写或草书文本,文本识别的准确率可能很低。
https://stackoverflow.com/questions/35850340
复制相似问题