提取图片、视频、文献信息的阅读辅助神器:天若OCR文字识别工具

平时,我们参加一个会议,拍下了关键图片,想搜索相关的文献,却要一个一个字母输入搜索;看一个视频,觉得里面的台词很好,想记录下来,看视频一个一个字母码出来?;网上搜索一些文档,不能下载,却想引用这些资料里面的文字,却碰到复制权限的限制(不给复制),那怎么办?;看一篇文献,有一些单词看不懂,也要一个一个码出来搜索,翻译?

基于以上问题,笔者给大伙分享一个工具——天若ocr文字识别,它可以帮我们完美解决这类问题。

首先,先给大伙简单说下OCR。OCR(optical character recognition)文字识别,是指电子设备(例如扫描仪或数码相机)检查纸上打印的字符,然后用字符识别方法将形状翻译成计算机文字的过程。打个比方,书本上有段精彩的文字,想在电脑保存下来,但书上的文字是属于书的,那么,将书本上的文字转换为我们电脑上常用的文字,就是OCR了。

天若ocr文字识别,是一项集合百度、腾讯、有道、搜狗的ocr接口,免费不限次数(有道免费接口有ip限制仅供娱乐)的工具

1、对于搜狗的接口调用的还是http://ocr.shouji.sogou.com/v2/ocr/json,这个接口识别效果很好,但是对于图片的尺寸有规定。作者对截取图片进行了尺寸上的优化,保证较小的文字也能识别。具体大家可以自行测试。 2、腾讯ocr接口,也比较准确,但是速度比较慢。 3、百度ocr接口,精确度还可以,但是标点符号识别不准确,速度一般。 4、有道ocr接口,速度很快平均0.3-0.4秒就可识别出来。但是接口受ip请求的限制。(仅供参考) 5、竖排文本识别接口,竖排文本识别需要依赖识别模块cvextern.dll。

安装和使用方法

安装:软件无需安装,直接运行即可。

使用方法:打开后就会安静地在后台待着,需要使用时按默认的 F4 键双击运行图标呼出截图框,就可选择你需要识别的内容范围,截图之后松开左键即可识别文字。识别出文字后,可进一步操作,就看你如何操作了(可合拼段落,翻译,朗读等)。

见下效果:

图片识别

在线文档识别

视频识别

PDF识别

感觉可以用作文献阅读助手了。

操作贼简单,笔者就不过多强调了。大伙可以多点尝试。

简单说下,该工具功能强大的地方在于:

1.突破各种不同媒介(图片、视频等)之间的障碍; 2.识别后的文字的可调整(段落拆分、合拼等); 3.文字便于复制黏贴(免去码字烦恼); 4.快速翻译,可充当文献阅读助手; 5.识别后的文字可朗读(学习英语的能手?)。

感谢开发者。

最后,提醒一下,软件不能使用的原因:

1、缺少.net框架,最低需要安装.net4.0。原则上你只要安装了这个版本的框架xp系统也可以使用。 2、快捷键冲突更换快捷键(右键点击运行图标,进入设置界面,可设置)。 3、出现按下截图键,屏幕放大情况的请右键属性,禁用dpi的显示缩放。 4、需联网,联网,联网。

原文发布于微信公众号 - 百味科研芝士(keyanzhishi)

原文发表时间:2019-05-20

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

扫码关注云+社区

领取腾讯云代金券