腾讯云OCR文字识别“测评”

本文目录

前言

前不久有朋友为了方便工作,问我“怎么把图片中的文字提取出来”,我当时就想到手机QQ扫一扫刚好可以实现这个功能,就让他先将图片传到手机,然后再用手机QQ扫一扫

告诉他之后,我也感觉有点不妥,要是一张两张还好,要是图片多了,一直把图片传到手机,用手机QQ扫是极其影响工作效率的,然后就去百度了下看看有没有那种在线识别的,居然没找到。于是乎,作为一个“程序员”,哪能被这些东西给难倒,于是开启了我的探索之旅。

API选择

在看了众多接口后,如七牛云、搜狗、百度、有道等等ORC接口面前,我选择了良心云。

完善的API文档,良心的计费方式,体验还是蛮不错的。

这里我选择的是 OCR-通用印刷体识别

腾讯云OCR

简介:

支持http和https协议

请求头:

host:recognition.image.myqcloud.com

content-type:multipart/form-data

authorization:鉴权签名生成方式

返回内容

返回内容示例(不完整):

HTTP/1.1 200 OK Connection: keep-alive Content-Length: 404 Content-Type: application/json { "data":{ "items":[ { "itemstring":"手机", "itemcoord":{"x":0,"y":100,"width":40,"height":20}, "words":[ {"character":"手","confidence":90.9}, {"character":"机","confidence":93.9} ] } ], "session_id":"", }, "code":0, "message":"OK" }

12345678910111213141516171819202122

HTTP/1.1 200 OKConnection: keep-aliveContent-Length: 404Content-Type: application/json {  "data":{"items":[  {    "itemstring":"手机",    "itemcoord":{"x":0,"y":100,"width":40,"height":20},    "words":[      {"character":"手","confidence":90.9},      {"character":"机","confidence":93.9}    ]  }],    "session_id":"",  },  "code":0,  "message":"OK"}

计费方式

调用注意事项

1.authorization生成

我就卡这里很久,后来才发现是没开通万象优图

首先,必须开通万象优图,记住Bucket名称

其次,进入API管理系统,记住 APPIDSecretIdSecretKey

查看authorization生成文档,按照官方给出的authorization函数,生成authorization即可。

2.请求头参数

content-length为非必选参数,建议不填。以下为必填。

host:recognition.image.myqcloud.com

content-type:multipart/form-data

authorization:(哈希值)

PHP源码分享

其实也没啥,不超过100行代码。大家可以参考下,有bug可以留言。(PHP版本7.2)

Github地址:https://github.com/qcgzxw/OCR

在线体验:https://test.freed.ga/OCR

使用体验:

  • 返回值很详细,包括文字出现的X,Y值,单个文字置信度,文字偏转角度,等等···
  • 返回值丰富,便于开发
  • 无法识别旋转角度不同的文字。(例如,有一半的文字是水平的,另一半是有超过45°的偏斜,将无法识别)
  • 文字采用单个识别,未添加联想。
  • 部分小图标会被识别为文字。

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏沃趣科技

容器化RDS|调度策略

前文我们介绍了基于 Kubernetes 实现的下一代私有 RDS. 其中, 调度策略是具体实现时至关重要的一环, 它关系到 RDS 集群的服务质量和部署密度....

38610
来自专栏云+创业计划

如何用腾讯云打造一款微视频 APP

本文主要讲解了如何将腾讯云提供的音视频上传下载、万象优图图片存储以及处理(缩放、裁剪、水印)等功能集成到了APP和业务端服务器中,打造一款微视频APP。

2.3K1
来自专栏Jerry的SAP技术分享

SAP Cloud for Customer客户主数据的重复检查-Levenshtein算法

SAP C4C的客户主数据创建时的重复检查,基于底层HANA数据库的模糊查找功能,根据扫描数据库中已有的数据检测出当前正在创建的客户主数据是否和数据库中记录有重...

1202
来自专栏AI科技大本营的专栏

全文来了!打败DBA老炮,机器学习如何改变数据库管理系统

作者 | Dana Van Aken、Andy Pavlo、Geoff Gordon 编译 | AI100 数据库管理系统(DBMSs)是所有数据密集型应用的...

37912
来自专栏Python爬虫与数据挖掘

如何利用Python词云和wordart可视化工具对朋友圈数据进行可视化展示

大前天我们通过Python网络爬虫对朋友圈的数据进行了抓取,感兴趣的朋友可以点击进行查看,如何利用Python网络爬虫抓取微信朋友圈的动态(上)...

1975
来自专栏北京马哥教育

基础拾遗--【转】网站带宽计算

我们通常说的网站流量(traffic)就是指网站的访问量,是用来描述访问一个网站的用户数量以及用户所浏览的网页数量等指标,常用的统计指标包括网站的独立用户数量、...

4157
来自专栏Python爬虫与数据挖掘

如何利用Python词云和wordart可视化工具对朋友圈数据进行可视化展示

大前天我们通过Python网络爬虫对朋友圈的数据进行了抓取,感兴趣的朋友可以点击进行查看,如何利用Python网络爬虫抓取微信朋友圈的动态(上)...

902
来自专栏杨建荣的学习笔记

元数据看板的初步设计思路

今天在飞机上整理了一个初版的元数据看板接口的设计需求,然后又以设计图表的形式补充了一版,整体来说,这个元数据库看板的接口逻辑就梳理差不多了。

1433
来自专栏MixLab科技+设计实验室

DIY一个以图搜图引擎1

大家好,凡关注本公众号的用户都可参与到这个小实验中来,基于微信头像的数据,我发现这几个有趣的事情(注意保密,以下都只显示头像,我也只能取到头像和昵称的数据,其他...

3757
来自专栏JAVA技术站

灰度环境发布策略 转

灰度发布是指在黑与白之间,能够平滑过渡的一种发布方式。AB test就是一种灰度发布方式,让一部分用户继续用A,一部分用户开始用B,如果用户对B没有什么反对意见...

1403

扫码关注云+社区

领取腾讯云代金券