腾讯云OCR文字识别“测评”

前言

前不久有朋友为了方便工作,问我“怎么把图片中的文字提取出来”,我当时就想到手机QQ扫一扫刚好可以实现这个功能,就让他先将图片传到手机,然后再用手机QQ扫一扫 。

告诉他之后,我也感觉有点不妥,要是一张两张还好,要是图片多了,一直把图片传到手机,用手机QQ扫是极其影响工作效率的,然后就去百度了下看看有没有那种在线识别的,居然没找到。于是乎,作为一个“程序员”,哪能被这些东西给难倒,于是开启了我的探索之旅。

API选择

在看了众多接口后,如七牛云、搜狗、百度、有道等等ORC接口面前,我选择了良心云。

完善的API文档,良心的计费方式,体验还是蛮不错的。

这里我选择的是 OCR-通用印刷体识别

腾讯云OCR

简介:

支持http和https协议

请求头:

host:recognition.image.myqcloud.com

content-type:multipart/form-data

authorization:鉴权签名生成方式

返回内容

返回内容示例(不完整):

12345678910111213141516171819202122

HTTP/1.1 200 OKConnection: keep-aliveContent-Length: 404Content-Type: application/json {  "data":{"items":[  {    "itemstring":"手机",    "itemcoord":{"x":0,"y":100,"width":40,"height":20},    "words":[      {"character":"手","confidence":90.9},      {"character":"机","confidence":93.9}    ]  }],    "session_id":"",  },  "code":0,  "message":"OK"}

计费方式

调用注意事项

1.authorization生成

我就卡这里很久,后来才发现是没开通万象优图

首先,必须开通万象优图,记住Bucket名称

其次,进入API管理系统,记住 APPIDSecretIdSecretKey

查看authorization生成文档,按照官方给出的authorization函数,生成authorization即可。

2.请求头参数

content-length为非必选参数,建议不填。以下为必填。

host:recognition.image.myqcloud.com

content-type:multipart/form-data

authorization:(哈希值)

PHP源码分享

其实也没啥,不超过100行代码。大家可以参考下,有bug可以留言。(PHP版本7.2)

Github地址:https://github.com/qcgzxw/OCR

在线体验:https://test.freed.ga/OCR

使用体验:

  • 返回值很详细,包括文字出现的X,Y值,单个文字置信度,文字偏转角度,等等···
  • 返回值丰富,便于开发
  • 无法识别旋转角度不同的文字。(例如,有一半的文字是水平的,另一半是有超过45°的偏斜,将无法识别)

原创声明,本文系作者授权云+社区发表,未经许可,不得转载。

如有侵权,请联系 yunjia_community@tencent.com 删除。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏我的小碗汤

推荐一款提高效率的工具

在工作中经常会遇到PDF转Word等可编辑文本情况,相信很多小伙伴用的是文字一个一个打,图片一个一个截的笨办法了。今天小编也和大家一样,准备这样搞,但是篇幅实在...

1613
来自专栏数据小魔方

细分饼图

今天跟大家分享的是一种叫做细分饼图的图表制作技巧! 它所用到的技巧很简单,表达的数据也不很复杂,就是三层数据结构,每一层都是上一层的细分数据。 首先我们还是来看...

3615
来自专栏Python爬虫与算法进阶

敲敲级简单的鉴别H图片的小程序

首先,来看一下程序运行结果的截图 ? 功能实现 一、下载SDK pip install qcloud_image 先贴出官方给的实例代码: #!/usr/bi...

3314
来自专栏数据小魔方

树状图(Tree Map)

今天跟大家分享的是树状图! ▼ 树状图(treemap)是一种经常用来展示多层级数据的分析工具。主要是使用矩形的面积、颜色、来显示复杂的层级数据关系,能够直观体...

57710
来自专栏量子位

MIT研究人员发明漏洞修复系统,可自动给代码打补丁 | 附论文

安妮 编译自 MIT News 量子位 出品 | 公众号 QbitAI 点开许久不用的“XX旅行”,你想买张回家的车票。页面上弹出的升级提示写着: 本次升级将修...

3157
来自专栏Python中文社区

用 Python 从零开始玩微信跳一跳

关注 Python 的人想必都知道 跳一跳辅助外挂 这个项目近来在 Github 上火得不行,相信不少人也可能尝试过一番,并暗暗叹息,为什么我一开始就没有这个...

2416
来自专栏葡萄城控件技术团队

应用系统中常见报表类型解析

根据报表的布局、数据源结构、打印方式和数据分析方式,可将应用系统中的报表分为以下类型: 清单报表 图表报表 分栏报表 分组报表 交叉报表 并排报表 ...

2255
来自专栏ATYUN订阅号

人工智能为什么能做的事情这么多?密码猜测在它面前也能行得通

密码猜测之所以有效是因为… 人类是可预测的 ? 如果你要求小明设置一个密码。他可能只是简单地把密码设置为“xiaoming”。现在,系统告诉他密码必须包含数字...

3516
来自专栏开源项目

你真的会用 Issue 吗?

大家对 Issue 一定不陌生,它灵活又实用,可以用来做 Bug 跟踪、需求管理、项目管理、交流探讨、写文章…… 不少新用户在后台问我们,如何优雅地使用 Iss...

3055
来自专栏小小詹同学

知乎大神爬取高颜值美女(Python爬虫+人脸检测+颜值检测)

这是一篇来自知乎大神的技术文章

93510

扫码关注云+社区

领取腾讯云代金券