前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >Mac用户的福音:OCR新神器,一键转换屏幕上的任意文本

Mac用户的福音:OCR新神器,一键转换屏幕上的任意文本

作者头像
机器之心
发布2021-06-08 10:44:11
1.3K0
发布2021-06-08 10:44:11
举报
文章被收录于专栏:机器之心机器之心

机器之心报道

编辑:杜伟

Mac 平台上的 OCR 文字识别方法有很多,比如 iText、OCRKit 等。本文介绍的 macOCR 命令行应用程序使 Mac 用户有了一个新选择。

在机器学习和计算机视觉领域,光学字符识别(optical character recognition, OCR)长期以来都是人们研究的重要主题之一。OCR 很简单,就是将文档照片或场景照片转换为机器编码的文本。

关于 OCR 的工具,机器之心此前也介绍过不少,如 2020 年频频登上 Github Trending 日榜月榜的开源项目 PaddleOCR,目前该项目已经获得 12.6k star 量。此外还有旷视研究院与华中科大联合研发的基于分割的场景文字识别方法 TextScanner,不仅可以正确读取字符数据,还在一系列相关文字基准数据集上取得了当前最佳性能。

近日,GitHub 上又出现了一个非常火的 OCR 工具 macOCR,短短一天时间,就收获了近800赞。macOCR 是一个开源命令行应用程序,用户可以使用它将屏幕上的任何文本转换为剪贴板上的文本。

项目地址:https://github.com/schappim/macOCR

当你调用 ocr 命令时,一个类似于光标的「屏幕捕获」(screen capture)就会出现。如此一来,边框内的任何文本都将转换为纯文本。

项目作者提供了如下动图展示,将图片文本转换为了文本。

对于 macOCR 命令行应用程序,网友给予了高度评价。网友 @mromanuk 表示:「我很沮丧的是,一直以来没有简单的方法来提取 Mac 图片中的文本。现在 macOCR 弥补了这一空白!这一功能应该在 MacOS 中集成或随时可用。」

安装使用

用户使用的操作系统需要是 macOS Catalina 及以上版本。

用户可以选择编译以下 repo 中的代码,或者下载预先构建的二进制(分为苹果 Silicon 处理器和英特尔处理器)并放在自己的路径中。

苹果 Silicon 处理器安装代码:

代码语言:javascript
复制
curl -O https://files.littlebird.com.au/ocr.zip; 
unzip ocr.zip;
sudo cp ocr /usr/local/bin;

英特尔处理器安装代码:

代码语言:javascript
复制
curl -O https://files.littlebird.com.au/ocr-EPiReQzFJ5Xw9wElWMqbiBayYLVp.zip; 
unzip ocr-EPiReQzFJ5Xw9wElWMqbiBayYLVp.zip;
sudo cp ocr /usr/local/bin;

当首次运行 macOCR app 时,用户可能需要「允许该 app 访问你的屏幕」,示意图如下:

项目作者

macOCR 的创建者是 Marcus Schappi,现为 Chick Global 的 CEO 和联合创始人。他还曾是 Little Bird Electronics 和 Geek Ammo 等其他其他几家公司的联合创始人。

Schappi 曾在澳大利亚巴克学院、悉尼科技大学以及悉尼大学就读。其中,在攻读悉尼科技大学工程创新、机电一体化及创业学士学位期间,他没有获得该学位。但由于其创建的海啸预警软件吸引了媒体的广泛关注,他最终被悉尼大学研究生项目录取,攻读设计科学硕士(设计计算及计算)。

Schappi 在软件开发、移动应用以及 IOS 开发等方面具有娴熟的技能。

目前,他的 GitHub 主页上有多个项目,比如 macOCR、kod-website、dropcam 等。

参考链接:https://news.ycombinator.com/item?id=27242392

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2021-05-24,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 机器之心 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
文字识别
文字识别(Optical Character Recognition,OCR)基于腾讯优图实验室的深度学习技术,将图片上的文字内容,智能识别成为可编辑的文本。OCR 支持身份证、名片等卡证类和票据类的印刷体识别,也支持运单等手写体识别,支持提供定制化服务,可以有效地代替人工录入信息。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档