通用文字识别

最近更新时间:2019-08-26 18:34:02

产品介绍

通用文字识别(General Optical Character Recognition,General OCR)基于业内领先的深度学习技术,提供通用印刷体识别、通用印刷体识别(高精度版)、通用手写体识别、英文识别等多种服务,支持将图片上的文字内容,智能识别为可编辑的文本,可应用于随手拍扫描、纸质文档电子化、电商广告审核等多种场景,大幅提升信息处理效率。

产品功能

通用印刷体识别

支持多场景、任意版面下整图文字的识别。支持自动识别语言类型,同时支持自选语言种类(推荐),除中英文外,支持日语、韩语、西班牙语、法语、德语、葡萄牙语、越南语、马来语、俄语、意大利语、荷兰语、瑞典语、芬兰语、丹麦语、挪威语、匈牙利语、泰语等多种语言。应用场景包括:印刷文档识别、网络图片识别、广告图文字识别、街景店招识别、菜单识别、视频标题识别、头像文字识别等。

通用印刷体识别(高精度版)

支持图像整体文字的检测和识别,返回文字框位置与文字内容。相比通用印刷体识别接口,准确率和召回率更高。

通用印刷体识别(高速版)

支持图像整体文字的检测和识别,返回文字框位置与文字内容。暂未支持多语种识别,推荐使用通用印刷体识别接口。

通用手写体识别

支持多场景、任意版面下整图文字中的手写中文、英文、字母、数字、常见字符的识别。针对手写字体无规则、字迹潦草、模糊等特点进行了识别能力的增强。可应用于银行、保险、金融等手写单据录入、教育行业笔记文档化等场景。

英文识别

支持图像英文文字的检测和识别,返回文字框位置与文字内容。支持多场景、任意版面下的英文、字母、数字和常见字符的识别,同时覆盖英文印刷体和英文手写体识别。可应用于英文笔记作业文档化、英文试卷答题卡识别等场景。

产品优势

能力全面

支持中英文、日文、韩文、西班牙文、法文、德文、葡萄牙文、阿拉伯数字及常用符号等的识别。并不断更新迭代模型,扩充支持的广度。

算法领先

支持图片中文字的自动自动定位和识别,印刷体整体识别准确率达95%以上,手写体达90%以上,保证99.5%以上产品可用性。

鲁棒性强

支持多场景、任意版面、任意背景,可容忍透视畸变、光照不均等复杂场景,并可实现自动裁边、修正倾斜等。

应用场景

纸质文档电子化

使用通用文字识别技术,助您完成大量的文档整理工作,从书籍、纸质论文、档案、PPT 课件等印刷资料,到课堂笔记、作业作文等手写内容,均可实现拍照自动识别文字,方便用户进行文本录入和文档管理,提高产品易用性和用户体验。

内容审核与管理

识别图像中的违规文字,如社交和电商等应用中的的违规内容、宣传物料中的广告用语、视频中的广告、标题与字幕等垃圾文本,提示相应风险,协助用户进行违规处理,帮助用户有效规避业务风险。

随手拍扫描

支持快速识别路标、指示牌、广告牌、街边店铺招牌、商品包装、购物小票等生活场景中的实体文字信息,应用于地图、翻译、搜索、生活出行等移动应用中,方便用户进行文本的提取或录入,有效提升产品易用性和用户使用体验。