1.注册腾讯云 2.开通【文字识别】服务 (目前官网赠送了免费的额度) 3.体验demo ()
2.开通服务---立即开通---文字识别控制台---体验demo
体验demo平台提供了各行业的ocr识别功能体验,
(按照图片中1.2.3步骤)即可完成体验
上传了一个自己手写的图片,识别准确率很高,没识别出来的那就是自己写的不规范哈,但发现段落换行不是很准确。
上传一个带有公式的图片,识别结果还比较满意,但公式不能复制
demo中的几何图片没有识别出来
识别结果很准确
结果模糊文本字体提亮了(提供了 切片增强,去除阴影,提亮模式,文字锐化,黑白模式等)
1.在【公式识别】体验中发现公式好像还是识别为图片,识别不准确的话不能复制到word文档中进行二次修改
对于爱手写数理化、统计学教案的老师来说,公式识别能赋能工作。
2.识别结果能提供【复制】按钮功能来,把识别的文字粘贴到word中进行二次修改
可以根据以下介绍选择合适的使用方式: 1. 通过腾讯云 文字识别体验Demo 进行产品功能体验。 如果您非业务开发者,没有代码编写基础,您可以使用该方式体验文字识别服务。该方式只能用于体验,不能用于开发,一次只能识别一张图片。 2. 通过可视化工具(API 3.0 Explorer 或 Postman)调用文字识别服务,具体实践请参考 可视化调用文字识别服务。 如果您是开发初学者,有代码编写基础,对 HTTP 请求和 API 调用有一定的了解,您可以通过此方式使用文字识别服务。 3. 通过编写代码调用文字识别服务,具体实践请参考 一分钟代码接入服务端 API 。 如果您是开发工程师,熟悉代码编写,您可以通过腾讯云已编写好的开发工具集(SDK)来调用文字识别服务。 4. 通过集成客户端 SDK 的方式进行产品功能体验,具体实践可参考 一分钟跑通 Demo 。 如果您是客户端开发工程师,熟悉代码编写,您可以通过腾讯云已编写好的开发组件(SDK)在客户端集成文字识别的能力。目前客户端 SDK 主要支持的 Android、iOS 平台。您可以在 客户端 SDK 中心 获取对应的 SDK 包。
以下是一个使用腾讯云OCR SDK的示例
from tencentcloud.common import credential
from tencentcloud.common.profile.client_profile import ClientProfile
from tencentcloud.common.profile.http_profile import HttpProfile
from tencentcloud.ocr.v20181119 import ocr_client, models
# 使用您的腾讯云 SecretId 和 SecretKey
cred = credential.Credential("Your SecretId", "Your SecretKey")
httpProfile = HttpProfile()
httpProfile.endpoint = "ocr.tencentcloudapi.com"
clientProfile = ClientProfile()
clientProfile.httpProfile = httpProfile
client = ocr_client.OcrClient(cred, "ap-guangzhou", clientProfile)
# 创建请求对象并设置参数
req = models.GeneralBasicOCRRequest()
params = '{"ImageBase64":"BASE64编码的图像数据"}'
req.from_json_string(params)
# 发送请求并获取响应
resp = client.GeneralBasicOCR(req)
print(resp.to_json_string())
另外平台还提供了自定化需求的入口给个大大的赞
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。