服务端 API 文档

文档捉虫大赛火热进行中,好礼多多> HOT

产品介绍

通用文字识别(General Optical Character Recognition,General OCR)基于行业前沿的深度学习技术,提供通用印刷体识别、通用印刷体识别(高精度版)、通用手写体识别、英文识别、健康码识别、通信行程卡识别等多种服务,支持将图片上的文字内容,智能识别为可编辑的文本,可应用于随手拍扫描、纸质文档电子化、电商广告审核等多种场景,大幅提升信息处理效率。

产品功能

通用印刷体识别

支持多场景、不同版面下整图文字的识别。支持自动识别语言类型,同时支持自选语言种类(推荐),除中英文外,支持日语、韩语、西班牙语、法语、德语、葡萄牙语、越南语、马来语、俄语、意大利语、荷兰语、瑞典语、芬兰语、丹麦语、挪威语、匈牙利语、泰语等多种语言。应用场景包括:印刷文字识别、网络图片文字识别、广告图文字识别、街景店招文字识别、菜单文字识别、视频标题文字识别、头像文字识别等。

通用印刷体识别(高精度版)

支持图像整体文字的检测和识别,返回文字框位置与文字内容。相比通用印刷体识别接口,准确率和召回率更高。

通用印刷体识别(精简版)

支持多场景、不同版面下整图文字的识别。相较于“通用印刷体识别”接口,精简版接口在准召率有一定损失的情况下,耗时更短。适用于对接口耗时较为敏感的客户。

通用印刷体识别(高速版)

支持图像整体文字的检测和识别,返回文字框位置与文字内容。暂未支持多语种识别,推荐使用通用印刷体识别接口。

通用手写体识别

支持多场景、不同版面下整图文字中的手写中文、英文、字母、数字、常见字符的识别。针对手写字体无规则、字迹潦草、模糊等特点进行了识别能力的增强。可应用于银行、保险、金融等手写单据录入、教育行业笔记文档化等场景。

英文识别

支持图像英文文字的检测和识别,返回文字框位置与文字内容。支持多场景、不同版面下的英文、字母、数字和常见字符的识别,同时覆盖英文印刷体和英文手写体识别。可应用于英文笔记作业文档化、英文试卷答题卡识别等场景。

广告文字识别

支持广告商品图片内文字的检测和识别,返回文本框位置与文字内容。支持中英文、横排和竖排文字识别,支持90度、180度、270度翻转以及倾斜场景文字识别。文字识别的召回率和准确率能达到96%以上。

健康码识别

支持北京、上海、广东、江苏、吉林、黑龙江、天津、辽宁、浙江、河南、四川、贵州、山东、安徽、福建、江西、湖北、湖南等省份健康码的识别,包括持码人姓名、持码人身份证号、健康码更新时间、健康码颜色、核酸检测结果、核酸检测间隔时长、核酸检测时间,疫苗接种信息,八个字段的识别结果输出。

通信行程卡识别

支持通信大数据行程卡识别,包括行程卡颜色、更新时间、途经地、存在中高风险地区的城市、电话号码,五个字段的识别结果输出。

文本图像增强

文本图像增强是面向文档类图片提供的图像增强处理能力,包括切边增强、图像矫正、阴影去除、摩尔纹去除等;可以有效优化文档类的图片质量,提升文字的清晰度。

快速文本检测

通过检测图片中的文字信息特征,快速判断图片中有无文字并返回判断结果,帮助用户过滤无文字的图片。

产品优势

能力全面

支持中英文、日文、韩文、西班牙文、法文、德文、葡萄牙文、阿拉伯数字及常用符号等的识别。并不断更新迭代模型,扩充支持的广度。

算法领先

支持图片中文字的自动定位和识别,印刷体整体识别准确率达95%以上,手写体整体识别准确率达90%以上,保证99.5%以上产品服务可用性。

鲁棒性强

支持多场景、不同版面、不同背景,可容忍透视畸变、光照不均等复杂场景,并可实现自动裁边、修正倾斜等。

应用场景

纸质文档电子化

使用通用文字识别技术,助您完成大量的文档整理工作,从书籍、纸质论文、档案、PPT 课件等印刷资料,到课堂笔记、作业作文等手写内容,均可实现拍照自动识别文字,方便用户进行文本录入和文档管理,提高产品易用性和用户体验。

内容审核与管理

识别图像中的不良文字,如社交和电商等应用中的不文明内容、宣传物料中的广告用语、视频中的广告、标题与字幕等垃圾文本,提示相应风险,协助用户进行审核处理,帮助用户有效规避业务风险。

随手拍扫描

支持快速识别路标、指示牌、广告牌、街边店铺招牌、商品包装、购物小票等生活场景中的实体文字信息,应用于地图、翻译、搜索、生活出行等移动应用中,方便用户进行文本的提取或录入,有效提升产品易用性和用户使用体验。

目录