前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >玩转OCR | 腾讯云智能结构化识别初体验

玩转OCR | 腾讯云智能结构化识别初体验

原创
作者头像
度假的小鱼
发布2025-01-08 15:31:37
发布2025-01-08 15:31:37
31900
代码可运行
举报
文章被收录于专栏:产品体验产品体验
运行总次数:0
代码可运行

腾讯云智能结构化OCR

准备工作

1.注册腾讯云 2.开通【文字识别】服务 (目前官网赠送了免费的额度) 3.体验demo ()

1.注册腾讯云

2.开通服务---立即开通---文字识别控制台---体验demo

demo体验

体验demo平台提供了各行业的ocr识别功能体验,

体验demo

1.通用手写体识别体验

(按照图片中1.2.3步骤)即可完成体验

上传了一个自己手写的图片,识别准确率很高,没识别出来的那就是自己写的不规范哈,但发现段落换行不是很准确

2.公式识别体验

上传一个带有公式的图片,识别结果还比较满意,但公式不能复制

3.试卷切图体验

demo中的几何图片没有识别出来

4.表格识别体验

识别结果很准确

5.文本图像增强

结果模糊文本字体提亮了(提供了 切片增强,去除阴影,提亮模式,文字锐化,黑白模式等)

体验过程中遇到的一些问题及改进建议

1.在【公式识别】体验中发现公式好像还是识别为图片,识别不准确的话不能复制到word文档中进行二次修改

对于爱手写数理化、统计学教案的老师来说,公式识别能赋能工作。

2.识别结果能提供【复制】按钮功能来,把识别的文字粘贴到word中进行二次修改

使用文字识别服务

可以根据以下介绍选择合适的使用方式: 1. 通过腾讯云 文字识别体验Demo 进行产品功能体验。 如果您非业务开发者,没有代码编写基础,您可以使用该方式体验文字识别服务。该方式只能用于体验,不能用于开发,一次只能识别一张图片。 2. 通过可视化工具(API 3.0 Explorer 或 Postman)调用文字识别服务,具体实践请参考 可视化调用文字识别服务 如果您是开发初学者,有代码编写基础,对 HTTP 请求和 API 调用有一定的了解,您可以通过此方式使用文字识别服务。 3. 通过编写代码调用文字识别服务,具体实践请参考 一分钟代码接入服务端 API 如果您是开发工程师,熟悉代码编写,您可以通过腾讯云已编写好的开发工具集(SDK)来调用文字识别服务。 4. 通过集成客户端 SDK 的方式进行产品功能体验,具体实践可参考 一分钟跑通 Demo 如果您是客户端开发工程师,熟悉代码编写,您可以通过腾讯云已编写好的开发组件(SDK)在客户端集成文字识别的能力。目前客户端 SDK 主要支持的 Android、iOS 平台。您可以在 客户端 SDK 中心 获取对应的 SDK 包。

以下是一个使用腾讯云OCR SDK的示例

代码语言:python
代码运行次数:0
运行
复制
from tencentcloud.common import credential
from tencentcloud.common.profile.client_profile import ClientProfile
from tencentcloud.common.profile.http_profile import HttpProfile
from tencentcloud.ocr.v20181119 import ocr_client, models

# 使用您的腾讯云 SecretId 和 SecretKey
cred = credential.Credential("Your SecretId", "Your SecretKey")
httpProfile = HttpProfile()
httpProfile.endpoint = "ocr.tencentcloudapi.com"

clientProfile = ClientProfile()
clientProfile.httpProfile = httpProfile
client = ocr_client.OcrClient(cred, "ap-guangzhou", clientProfile)

# 创建请求对象并设置参数
req = models.GeneralBasicOCRRequest()
params = '{"ImageBase64":"BASE64编码的图像数据"}'
req.from_json_string(params)

# 发送请求并获取响应
resp = client.GeneralBasicOCR(req)
print(resp.to_json_string())

小结

腾讯云智能结构化OCR应用领域

  • 商业领域:可用于订单处理、发票管理、产品条形码识别等,提高工作效率和准确性4。
  • 教育领域:能将纸质教材和资料转化为数字文本,方便学生查阅和学习,还可用于试卷扫描和自动批改作业等4。
  • 医疗领域:有助于病历管理和医学影像分析,方便医生查阅和编辑病历,提高诊断效率和准确性4。
  • 金融领域:可处理银行票据、保险理赔等业务,自动提取关键信息,便于数据分析和风险控制4。
  • 档案管理领域:对大量的纸质档案进行数字化处理,不仅可以节省存储空间,还方便档案的检索和利用。
  • 无障碍服务领域:可以将纸质书籍、文件等转换为电子文本,再通过文本转语音技术,为视障人士提供无障碍阅读服务。

另外平台还提供了自定化需求的入口给个大大的赞

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 腾讯云智能结构化OCR
    • 准备工作
  • demo体验
    • 1.通用手写体识别体验
    • 2.公式识别体验
    • 3.试卷切图体验
    • 4.表格识别体验
    • 5.文本图像增强
  • 体验过程中遇到的一些问题及改进建议
  • 使用文字识别服务
  • 小结
    • 腾讯云智能结构化OCR应用领域
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档