腾讯云OCR文字识别“测评”

本文目录

前言

前不久有朋友为了方便工作,问我“怎么把图片中的文字提取出来”,我当时就想到手机QQ扫一扫刚好可以实现这个功能,就让他先将图片传到手机,然后再用手机QQ扫一扫

告诉他之后,我也感觉有点不妥,要是一张两张还好,要是图片多了,一直把图片传到手机,用手机QQ扫是极其影响工作效率的,然后就去百度了下看看有没有那种在线识别的,居然没找到。于是乎,作为一个“程序员”,哪能被这些东西给难倒,于是开启了我的探索之旅。

API选择

在看了众多接口后,如七牛云、搜狗、百度、有道等等ORC接口面前,我选择了良心云。

完善的API文档,良心的计费方式,体验还是蛮不错的。

这里我选择的是 OCR-通用印刷体识别

腾讯云OCR

简介:

支持http和https协议

请求头:

host:recognition.image.myqcloud.com

content-type:multipart/form-data

authorization:鉴权签名生成方式

返回内容

返回内容示例(不完整):

HTTP/1.1 200 OK Connection: keep-alive Content-Length: 404 Content-Type: application/json { "data":{ "items":[ { "itemstring":"手机", "itemcoord":{"x":0,"y":100,"width":40,"height":20}, "words":[ {"character":"手","confidence":90.9}, {"character":"机","confidence":93.9} ] } ], "session_id":"", }, "code":0, "message":"OK" }

12345678910111213141516171819202122

HTTP/1.1 200 OKConnection: keep-aliveContent-Length: 404Content-Type: application/json {  "data":{"items":[  {    "itemstring":"手机",    "itemcoord":{"x":0,"y":100,"width":40,"height":20},    "words":[      {"character":"手","confidence":90.9},      {"character":"机","confidence":93.9}    ]  }],    "session_id":"",  },  "code":0,  "message":"OK"}

计费方式

调用注意事项

1.authorization生成

我就卡这里很久,后来才发现是没开通万象优图

首先,必须开通万象优图,记住Bucket名称

其次,进入API管理系统,记住 APPIDSecretIdSecretKey

查看authorization生成文档,按照官方给出的authorization函数,生成authorization即可。

2.请求头参数

content-length为非必选参数,建议不填。以下为必填。

host:recognition.image.myqcloud.com

content-type:multipart/form-data

authorization:(哈希值)

PHP源码分享

其实也没啥,不超过100行代码。大家可以参考下,有bug可以留言。(PHP版本7.2)

Github地址:https://github.com/qcgzxw/OCR

在线体验:https://test.freed.ga/OCR

使用体验:

  • 返回值很详细,包括文字出现的X,Y值,单个文字置信度,文字偏转角度,等等···
  • 返回值丰富,便于开发
  • 无法识别旋转角度不同的文字。(例如,有一半的文字是水平的,另一半是有超过45°的偏斜,将无法识别)
  • 文字采用单个识别,未添加联想。
  • 部分小图标会被识别为文字。

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏SDNLAB

如何像Facebook一样构建数据中心 – BGP在大规模数据中心中的应用(3)

作者简介:史梦晨,曾就职于国内金牌集成商, 现就职于EANTC( 欧洲高级网络测试中心),研究方向:网络架构,测试,运维(大规模数据中心,SD-WAN,EVPN...

1681
来自专栏AI科技大本营的专栏

全文来了!打败DBA老炮,机器学习如何改变数据库管理系统

作者 | Dana Van Aken、Andy Pavlo、Geoff Gordon 编译 | AI100 数据库管理系统(DBMSs)是所有数据密集型应用的...

36812
来自专栏FreeBuf

一种绕过限制下载论文的思路

注:本文下面的内容仅讨论绕过思路,作为技术交流之用。大家下载论文还是应该通过正规渠道,付费下载,尊重各位站长的劳动成果。敏感图片和代码中涉及站点的内容均已打码。

1412
来自专栏JAVA技术站

灰度环境发布策略 转

灰度发布是指在黑与白之间,能够平滑过渡的一种发布方式。AB test就是一种灰度发布方式,让一部分用户继续用A,一部分用户开始用B,如果用户对B没有什么反对意见...

883
来自专栏开源FPGA

基于FPGA的Uart接收图像数据至VGA显示

系统框图 ?   前面我们设计了基于FPGA的静态图片显示,并对一幅彩色图片提取了灰度,学习了RGB转Gray算法。这是基于一幅静态图片的,那么后面我们要怎么模...

2669
来自专栏编程微刊

微信小程序图片使用示例

2374
来自专栏前端笔记

【新手指南】浅谈几种WordPress固定链接的优劣势

新手建站须知: 所谓“固定链接”,其实就是指访问某个网页的特定链接。也是我们站长将网站提交给各大站长平台的重要参数之一!建站初期我们必须确定好“固定链接”(准确...

3177
来自专栏云+创业计划

如何用腾讯云打造一款微视频 APP

本文主要讲解了如何将腾讯云提供的音视频上传下载、万象优图图片存储以及处理(缩放、裁剪、水印)等功能集成到了APP和业务端服务器中,打造一款微视频APP。

1.9K1
来自专栏北京马哥教育

基础拾遗--【转】网站带宽计算

我们通常说的网站流量(traffic)就是指网站的访问量,是用来描述访问一个网站的用户数量以及用户所浏览的网页数量等指标,常用的统计指标包括网站的独立用户数量、...

3577
来自专栏上善若水

053[转]Android开发中如何匹配layout资源(layout-sw480dp layout-sw600dp-land layout-sw720dp-port)

ps : 很不错的文章,今天正好遇到类似问题,看到这篇文章,很顺利的找到了出错的layout。感谢一下

1142

扫码关注云+社区