提取图片、视频、文献信息的阅读辅助神器：天若OCR文字识别工具

百味科研芝士

发布于 2019-05-23 22:38:43

8.2K0

发布于 2019-05-23 22:38:43

文章被收录于专栏：百味科研芝士

平时，我们参加一个会议，拍下了关键图片，想搜索相关的文献，却要一个一个字母输入搜索；看一个视频，觉得里面的台词很好，想记录下来，看视频一个一个字母码出来？；网上搜索一些文档，不能下载，却想引用这些资料里面的文字，却碰到复制权限的限制（不给复制），那怎么办？；看一篇文献，有一些单词看不懂，也要一个一个码出来搜索，翻译？

基于以上问题，笔者给大伙分享一个工具——天若ocr文字识别，它可以帮我们完美解决这类问题。

首先，先给大伙简单说下OCR。OCR（optical character recognition）文字识别，是指电子设备（例如扫描仪或数码相机）检查纸上打印的字符，然后用字符识别方法将形状翻译成计算机文字的过程。打个比方，书本上有段精彩的文字，想在电脑保存下来，但书上的文字是属于书的，那么，将书本上的文字转换为我们电脑上常用的文字，就是OCR了。

天若ocr文字识别，是一项集合百度、腾讯、有道、搜狗的ocr接口，免费不限次数（有道免费接口有ip限制仅供娱乐）的工具。

1、对于搜狗的接口调用的还是http://ocr.shouji.sogou.com/v2/ocr/json，这个接口识别效果很好，但是对于图片的尺寸有规定。作者对截取图片进行了尺寸上的优化，保证较小的文字也能识别。具体大家可以自行测试。 2、腾讯ocr接口，也比较准确，但是速度比较慢。 3、百度ocr接口，精确度还可以，但是标点符号识别不准确，速度一般。 4、有道ocr接口，速度很快平均0.3-0.4秒就可识别出来。但是接口受ip请求的限制。（仅供参考） 5、竖排文本识别接口，竖排文本识别需要依赖识别模块cvextern.dll。