专栏首页小文博客腾讯云OCR文字识别“测评”

腾讯云OCR文字识别“测评”

本文目录

前言

前不久有朋友为了方便工作,问我“怎么把图片中的文字提取出来”,我当时就想到手机QQ扫一扫刚好可以实现这个功能,就让他先将图片传到手机,然后再用手机QQ扫一扫

告诉他之后,我也感觉有点不妥,要是一张两张还好,要是图片多了,一直把图片传到手机,用手机QQ扫是极其影响工作效率的,然后就去百度了下看看有没有那种在线识别的,居然没找到。于是乎,作为一个“程序员”,哪能被这些东西给难倒,于是开启了我的探索之旅。

API选择

在看了众多接口后,如七牛云、搜狗、百度、有道等等ORC接口面前,我选择了良心云。

完善的API文档,良心的计费方式,体验还是蛮不错的。

这里我选择的是 OCR-通用印刷体识别

腾讯云OCR

简介:

支持http和https协议

请求头:

host:recognition.image.myqcloud.com

content-type:multipart/form-data

authorization:鉴权签名生成方式

返回内容

返回内容示例(不完整):

HTTP/1.1 200 OK Connection: keep-alive Content-Length: 404 Content-Type: application/json { "data":{ "items":[ { "itemstring":"手机", "itemcoord":{"x":0,"y":100,"width":40,"height":20}, "words":[ {"character":"手","confidence":90.9}, {"character":"机","confidence":93.9} ] } ], "session_id":"", }, "code":0, "message":"OK" }

12345678910111213141516171819202122

HTTP/1.1 200 OKConnection: keep-aliveContent-Length: 404Content-Type: application/json {  "data":{"items":[  {    "itemstring":"手机",    "itemcoord":{"x":0,"y":100,"width":40,"height":20},    "words":[      {"character":"手","confidence":90.9},      {"character":"机","confidence":93.9}    ]  }],    "session_id":"",  },  "code":0,  "message":"OK"}

计费方式

调用注意事项

1.authorization生成

我就卡这里很久,后来才发现是没开通万象优图

首先,必须开通万象优图,记住Bucket名称

其次,进入API管理系统,记住 APPIDSecretIdSecretKey

查看authorization生成文档,按照官方给出的authorization函数,生成authorization即可。

2.请求头参数

content-length为非必选参数,建议不填。以下为必填。

host:recognition.image.myqcloud.com

content-type:multipart/form-data

authorization:(哈希值)

PHP源码分享

其实也没啥,不超过100行代码。大家可以参考下,有bug可以留言。(PHP版本7.2)

Github地址:https://github.com/qcgzxw/OCR

在线体验:https://test.freed.ga/OCR

使用体验:

  • 返回值很详细,包括文字出现的X,Y值,单个文字置信度,文字偏转角度,等等···
  • 返回值丰富,便于开发
  • 无法识别旋转角度不同的文字。(例如,有一半的文字是水平的,另一半是有超过45°的偏斜,将无法识别)
  • 文字采用单个识别,未添加联想。
  • 部分小图标会被识别为文字。

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • WordPress简约清新文艺主题——Variant

    神无月
  • Stay主题——WordPress精品主题分享

    神无月
  • 腾讯云OCR文字识别“测评”

    前不久有朋友为了方便工作,问我“怎么把图片中的文字提取出来”,我当时就想到手机QQ扫一扫刚好可以实现这个功能,就让他先将图片传到手机,然后再用手机QQ扫一扫 。

    神无月
  • 厉害了Word "VR眼动跟踪系统——竟能让玩家与虚拟人物建立关系

    VRPinea
  • HTTPS与HTTP

    上述过程中第2步骤中是存在风险的,因为公钥是暴露出来的,当公钥被中间人非法截获时,同时将公钥替换成中间人自己的公钥发送给客户端,从而得到对称加密的秘钥,进而伪装...

    用户6055494
  • 教你如何写出高性能的Mybatis分页插件

    最近做的一个需求需要写复杂的SQL,且需要分页,我是非常懒的人,因为项目中使用了mybatis-plus,因此分页想着使用mybatis-plus的分页插件自动...

    wujiuye
  • 你知道吗?计算机界也有诺贝尔奖!

    这几天2019年诺贝尔奖陆续颁布,诺贝尔奖最初分设物理、化学、生理学或医学、文学、和平等五个奖项,于1901年首次颁发。1968年,瑞典国家银行增加设立了诺贝尔...

    逆锋起笔
  • MWC 2018总结丨智能机“黑科技”耀眼,VR体验精彩依旧

    VRPinea
  • 让SQL成为一种生活方式:认识分页查询

    ? 1分页查询的书写方式 分页的目的就是控制输出结果集大小,将结果尽快的返回。 Oracle的分页查询语句有两种基本格式。第一种格式如下: ? 上面给出的这个...

    数据和云
  • Flink 动态表的持续查询

    越来越多的公司采用流处理,并将现有的批处理应用迁移到流处理,或者对新的用例采用流处理实现的解决方案。其中许多应用集中在流数据分析上,分析的数据流来自各种源,例如...

    smartsi

扫码关注云+社区

领取腾讯云代金券