专栏首页百味科研芝士提取图片、视频、文献信息的阅读辅助神器:天若OCR文字识别工具

提取图片、视频、文献信息的阅读辅助神器:天若OCR文字识别工具

平时,我们参加一个会议,拍下了关键图片,想搜索相关的文献,却要一个一个字母输入搜索;看一个视频,觉得里面的台词很好,想记录下来,看视频一个一个字母码出来?;网上搜索一些文档,不能下载,却想引用这些资料里面的文字,却碰到复制权限的限制(不给复制),那怎么办?;看一篇文献,有一些单词看不懂,也要一个一个码出来搜索,翻译?

基于以上问题,笔者给大伙分享一个工具——天若ocr文字识别,它可以帮我们完美解决这类问题。

首先,先给大伙简单说下OCR。OCR(optical character recognition)文字识别,是指电子设备(例如扫描仪或数码相机)检查纸上打印的字符,然后用字符识别方法将形状翻译成计算机文字的过程。打个比方,书本上有段精彩的文字,想在电脑保存下来,但书上的文字是属于书的,那么,将书本上的文字转换为我们电脑上常用的文字,就是OCR了。

天若ocr文字识别,是一项集合百度、腾讯、有道、搜狗的ocr接口,免费不限次数(有道免费接口有ip限制仅供娱乐)的工具

1、对于搜狗的接口调用的还是http://ocr.shouji.sogou.com/v2/ocr/json,这个接口识别效果很好,但是对于图片的尺寸有规定。作者对截取图片进行了尺寸上的优化,保证较小的文字也能识别。具体大家可以自行测试。 2、腾讯ocr接口,也比较准确,但是速度比较慢。 3、百度ocr接口,精确度还可以,但是标点符号识别不准确,速度一般。 4、有道ocr接口,速度很快平均0.3-0.4秒就可识别出来。但是接口受ip请求的限制。(仅供参考) 5、竖排文本识别接口,竖排文本识别需要依赖识别模块cvextern.dll。

安装和使用方法

安装:软件无需安装,直接运行即可。

使用方法:打开后就会安静地在后台待着,需要使用时按默认的 F4 键双击运行图标呼出截图框,就可选择你需要识别的内容范围,截图之后松开左键即可识别文字。识别出文字后,可进一步操作,就看你如何操作了(可合拼段落,翻译,朗读等)。

见下效果:

图片识别

在线文档识别

视频识别

PDF识别

感觉可以用作文献阅读助手了。

操作贼简单,笔者就不过多强调了。大伙可以多点尝试。

简单说下,该工具功能强大的地方在于:

1.突破各种不同媒介(图片、视频等)之间的障碍; 2.识别后的文字的可调整(段落拆分、合拼等); 3.文字便于复制黏贴(免去码字烦恼); 4.快速翻译,可充当文献阅读助手; 5.识别后的文字可朗读(学习英语的能手?)。

感谢开发者。

最后,提醒一下,软件不能使用的原因:

1、缺少.net框架,最低需要安装.net4.0。原则上你只要安装了这个版本的框架xp系统也可以使用。 2、快捷键冲突更换快捷键(右键点击运行图标,进入设置界面,可设置)。 3、出现按下截图键,屏幕放大情况的请右键属性,禁用dpi的显示缩放。 4、需联网,联网,联网。

本文分享自微信公众号 - 百味科研芝士(keyanzhishi),作者:Matteo

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2019-05-20

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • R语言系列第五期(番外篇):R语言与线性模型相关问题

    很多数据集本身非常复杂,按照标准的建模流程难以进行合适的处理,因此,需要构建特别的模型,线性模型提供了一个灵活的模型框架,在此框架内,我们得以对上述大部分复杂数...

    百味科研芝士
  • 深度解读5分+纯生信文章:都是方法,但还是有“贵贱”之分

    无监督学习方法通常用于分析基因组平台数据。然而这些方法忽略了前列腺样本中的大量的异质成分。那么这篇文章的研究的目的就是使用更复杂的分析方法对前列腺癌转录组数据的...

    百味科研芝士
  • 手把手学习TCGA数据库:SNP突变分析第七期

    各位科研芝士的朋友,大家好,前面一讲给大家分享了如何借助maftools工具实现对SNP数据的可视化操作,今天我们继续剖析该包的其他用法。还记得上次我们提到的o...

    百味科研芝士
  • 深度学习的主要应用举例

    参考资料 ? 最喜欢圆,尤其如此灵动 今天简单说一下 Deep Leaning 在各领域应用的几个例子,可以轻松地看一下它是怎么用在 Computer Visi...

    杨熹
  • 借你一双“慧眼”:一文读懂OCR文字识别︱技术派

    摘要:在日常生活工作中,我们难免会遇到一些问题,比如自己辛辛苦苦写完的资料,好不容易打印出来却发现源文件丢了;收集了一些名片,却要一个一个地录入信息,很麻烦;快...

    腾讯云AI中心
  • 【AIDL专栏】白翔:基于合成数据的场景文本深度表示方法

    目前的文字识别主要有两方面的研究。首先是传统的文字识别,也就是文档中的文字识别,主要是OCR技术,其技术已经比较成熟,效果也比较稳定。另一方面是基于场景的文字识...

    马上科普尚尚
  • 【Dev Club 分享】深度学习在 OCR 中的应用

    Dev Club 是一个交流移动开发技术,结交朋友,扩展人脉的社群,成员都是经过审核的移动开发工程师。每周都会举行嘉宾分享,话题讨论等活动。 本期,我们邀请了 ...

    腾讯Bugly
  • 01. OCR 文字识别学习路径

    由于最近在接触一些OCR的工作,所以本期《晓说AI》和大家分享一下我的一些总结,先从基本的概念讲起。如有错误,还请指正,谢你3千遍。如有疑问,欢迎留言,我会第一...

    Aalto
  • 场景文字识别技术,过滤黄赌毒

    作者介绍: 数据平台部OCR+团队负责人。2008年毕业于中国科学院研究生院,主攻模式识别、计算机视觉、图像处理、以及深度学习等方向。读研期间曾在模式识别顶级期...

    腾讯技术工程官方号
  • 文本分类又来了,用 Scikit-Learn 解决多类文本分类问题

    在商业领域有很多文本分类的应用,比如新闻故事通常由主题来分类;内容或产品常常被打上标签;基于如何在线谈论产品或品牌,用户被分成支持者等等。

    AI研习社

扫码关注云+社区

领取腾讯云代金券