玩转OCR | 腾讯云智能结构化识别初体验

原创

度假的小鱼

发布于 2025-01-08 15:31:37

31900

代码可运行

文章被收录于专栏：产品体验产品体验

运行总次数：0

代码可运行

腾讯云智能结构化OCR

准备工作

1.注册腾讯云 2.开通【文字识别】服务（目前官网赠送了免费的额度） 3.体验demo ()

1.注册腾讯云

2.开通服务---立即开通---文字识别控制台---体验demo

demo体验

体验demo平台提供了各行业的ocr识别功能体验，

体验demo

1.通用手写体识别体验

（按照图片中1.2.3步骤）即可完成体验

上传了一个自己手写的图片，识别准确率很高，没识别出来的那就是自己写的不规范哈，但发现段落换行不是很准确。

2.公式识别体验

上传一个带有公式的图片，识别结果还比较满意，但公式不能复制

3.试卷切图体验

demo中的几何图片没有识别出来

4.表格识别体验

识别结果很准确

5.文本图像增强

结果模糊文本字体提亮了（提供了切片增强，去除阴影，提亮模式，文字锐化，黑白模式等）

体验过程中遇到的一些问题及改进建议

1.在【公式识别】体验中发现公式好像还是识别为图片，识别不准确的话不能复制到word文档中进行二次修改

对于爱手写数理化、统计学教案的老师来说，公式识别能赋能工作。

2.识别结果能提供【复制】按钮功能来，把识别的文字粘贴到word中进行二次修改

使用文字识别服务

可以根据以下介绍选择合适的使用方式： 1. 通过腾讯云 文字识别体验Demo 进行产品功能体验。 如果您非业务开发者，没有代码编写基础，您可以使用该方式体验文字识别服务。该方式只能用于体验，不能用于开发，一次只能识别一张图片。 2. 通过可视化工具（API 3.0 Explorer 或 Postman）调用文字识别服务，具体实践请参考 可视化调用文字识别服务。如果您是开发初学者，有代码编写基础，对 HTTP 请求和 API 调用有一定的了解，您可以通过此方式使用文字识别服务。 3. 通过编写代码调用文字识别服务，具体实践请参考 一分钟代码接入服务端 API 。如果您是开发工程师，熟悉代码编写，您可以通过腾讯云已编写好的开发工具集（SDK）来调用文字识别服务。 4. 通过集成客户端 SDK 的方式进行产品功能体验，具体实践可参考 一分钟跑通 Demo 。如果您是客户端开发工程师，熟悉代码编写，您可以通过腾讯云已编写好的开发组件（SDK）在客户端集成文字识别的能力。目前客户端 SDK 主要支持的 Android、iOS 平台。您可以在客户端 SDK 中心获取对应的 SDK 包。

以下是一个使用腾讯云OCR SDK的示例

from tencentcloud.common import credential
from tencentcloud.common.profile.client_profile import ClientProfile
from tencentcloud.common.profile.http_profile import HttpProfile
from tencentcloud.ocr.v20181119 import ocr_client, models

# 使用您的腾讯云 SecretId 和 SecretKey
cred = credential.Credential("Your SecretId", "Your SecretKey")
httpProfile = HttpProfile()
httpProfile.endpoint = "ocr.tencentcloudapi.com"

clientProfile = ClientProfile()
clientProfile.httpProfile = httpProfile
client = ocr_client.OcrClient(cred, "ap-guangzhou", clientProfile)

# 创建请求对象并设置参数
req = models.GeneralBasicOCRRequest()
params = '{"ImageBase64":"BASE64编码的图像数据"}'
req.from_json_string(params)

# 发送请求并获取响应
resp = client.GeneralBasicOCR(req)
print(resp.to_json_string())

小结

腾讯云智能结构化OCR应用领域

商业领域：可用于订单处理、发票管理、产品条形码识别等，提高工作效率和准确性4。
教育领域：能将纸质教材和资料转化为数字文本，方便学生查阅和学习，还可用于试卷扫描和自动批改作业等4。
医疗领域：有助于病历管理和医学影像分析，方便医生查阅和编辑病历，提高诊断效率和准确性4。
金融领域：可处理银行票据、保险理赔等业务，自动提取关键信息，便于数据分析和风险控制4。
档案管理领域：对大量的纸质档案进行数字化处理，不仅可以节省存储空间，还方便档案的检索和利用。
无障碍服务领域：可以将纸质书籍、文件等转换为电子文本，再通过文本转语音技术，为视障人士提供无障碍阅读服务。

另外平台还提供了自定化需求的入口给个大大的赞

原创声明：本文系作者授权腾讯云开发者社区发表，未经许可，不得转载。

如有侵权，请联系 cloudcommunity@tencent.com 删除。

玩转腾讯云OCR

原创声明：本文系作者授权腾讯云开发者社区发表，未经许可，不得转载。

如有侵权，请联系 cloudcommunity@tencent.com 删除。

玩转腾讯云OCR

登录后参与评论

0 条评论

热度