首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >Alfred+workflows 快速截图ocr识别

Alfred+workflows 快速截图ocr识别

作者头像
HHTjim 部落格
发布2022-09-26 10:48:59
1.3K0
发布2022-09-26 10:48:59
举报
文章被收录于专栏:HHTjim'S 部落格HHTjim'S 部落格

Alfred+workflows 快速截图ocr识别

作者:matrix 被围观: 4,448 次 发布时间:2018-09-12 分类:零零星星 | 2 条评论 »

这是一个创建于 1450 天前的主题,其中的信息可能已经有所发展或是发生改变。

前些时间使用看到Alfred的ocr识别插件workflows插件真心不错,超实用的工具 完全胜任图片文字提取的工作。

mac自带的截图快捷工具我常常使用,但是能够截图之后马上对图片进行内容识别 这倒是很稀奇 至少我是这样。

一般专门的ocr软件我很少用 若要临时应急的话就会很麻烦 因为我需要去查找提供ocr识别服务的三方网站服务 然后进行图片上传 之后再复制内容到剪贴板。像这种情况下有个顺手的小工具是多爽 😆 😆 虽然插件也是使用开源库tesseract-ocr,但是整合到随手调用这就很少有人做了。

安装tesseract开源库

brew install tesseract #使用brew工具 tesseract --version #查看版本号

配置语言包

tesseract --list-langs #查看当前只是的语言

默认自带英文eng,简体中文为chi_sim

https://github.com/tesseract-ocr/tessdata

下载chi_sim_vert.traineddata,chi_sim.traineddata两文件放至/usr/local/Cellar/tesseract/3.05.02/share/tessdata。其中3.05.02为你安装的tesseract版本号

安装workflows

下载OCR

alfredworkflow被我简单添加了下触发关键字 cn中文,en英文

使用

ocr #默认所有中英文语言 ocr cn #指定识别中文 ocr en #指定识别英文

回车截图之后会出现消息通知(响应时间据字符长度而不定)

若内容为空 最好debug查看workflows报错信息

后续问题

自定义修改插件的时候发现有些时候输入的内容无法被Alfred读取 会被自动截断 无任何反应

这里是因为编码转换的问题导致的 确保输入内容以及输出内容的编码 过滤掉特殊字符

php处理:

 function force_utf8_safe($str) {
    $res = mb_convert_encoding($str, "UTF-8", "UTF-8" ); // replace invalid characters with ?
    $res = preg_replace('/\p{Cc}+/u', '?', $res); // replace control characters with ?
    return $res;
}

说明:

字符过滤来自于 https://github.com/willfarrell/alfred-encode-decode-workflow

还可以参考它的输入字符处理方式 使用normalise脚本再处理传入

参考:https://www.alfredforum.com/topic/10141-workflow-arguments-are-always-decomposed/

我的AlfredWorkflows:https://github.com/Hootrix/AlfredWorkflows

参考:

https://www.zhihu.com/question/20656680

https://tonydeng.github.io/2016/07/28/on-the-use-of-tesseract-picture-text-recognition/

PEACE~

本文参与 腾讯云自媒体分享计划,分享自作者个人站点/博客。
如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • Alfred+workflows 快速截图ocr识别
    • 安装tesseract开源库
      • 配置语言包
        • 安装workflows
          • 使用
            • 后续问题
            相关产品与服务
            文字识别
            文字识别(Optical Character Recognition,OCR)基于腾讯优图实验室的深度学习技术,将图片上的文字内容,智能识别成为可编辑的文本。OCR 支持身份证、名片等卡证类和票据类的印刷体识别,也支持运单等手写体识别,支持提供定制化服务,可以有效地代替人工录入信息。
            领券
            问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档