首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

iText for Mac(OCR识别图中文字工具)v1.7.6

itext mac中文特别版是一款从图片中识别文字的OCR(光学字符识别)工具。通过截图、拖拽图片,即可以从扫描版的PDF等任意图片中识字,并且可以很好的解决摘抄和批注需求。而且itext mac版使用腾讯、Google 双引擎,识别效果惊人地准确。此软件测试环境为10.14.4系统!

iText for mac特别版功能介绍

轻松选择图像

iText支持多种方式选择图像,操作非常方便。

捕获屏幕

iText内置屏幕捕获工具。只需按下快捷键1,捕获屏幕上的任何区域,即可提取其中的文本。提示:已识别的文本已复制到系统剪贴板。你可以直接粘贴。

将图像拖动到菜单栏图标

例如,当您在Twitter中看到图像并想要提取内部的文本或数字时,只需将图像拖动到iText的菜单栏图标,您就可以得到您想要的内容。

选择图像文件

当然,您也可以选择要识别的图片文件。但是,在这种情况下,优选上述拖动。

持续认可

例如,在PDF中截取不同位置的屏幕截图,iText将依次识别文本并自动连接结果。

由Google提供支持

首先,我排除了脱机识别库,因为离线库已经死了,无法自我改进。接下来,在许多在线OCR服务中,我比较了微软,谷歌等产品。最后,我选择了Google的服务,因为它非常强大,可以识别50多种语言。

- 对于普通的自然语言,例如书页,新闻稿,识别结果非常准确,甚至高达100%。

- 对于复杂排版,特别是对于特殊字符(例如,程序源代码),识别结果不是那么好,您可能需要在识别后手动修改结果。

- 例如,对于一条垂直线,机器无法区分小写字母l或大写字母I(顺便说一句,你能识别它们吗?); 相反,机器需要理解上下文以优化结果。但是现在机器很难理解程序源代码之类的非自然语言。

优化识别结果

OCR服务可以准确地识别图像中的文本,但不能用于进一步识别,例如段落识别等。

因此,iText包含自己的算法来优化结果,例如,

- 自动识别段落。

- 删除英文单词和标点符号之间的额外空格。

- 将英文的第一个字母大写。

预览原始图像以进行校对

由于目前的OCR技术不能始终100%识别文本,因此有必要检查原始图像以修改结果。在iText中,您可以:

- 拖动图像附近的结果窗口。

- 在结果窗口的左侧显示图像。

自动翻译

识别图像中的文本后,iText可以自动将它们翻译成100多种语言,由Google提供支持。

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20201209A03MYU00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券