有奖捉虫:办公协同&微信生态&物联网文档专题 HOT

智能结构化 OCR 具备什么能力?应用场景有哪些?

智能结构化 OCR 基于业界领先的深度学习技术和图像检测技术,提供针对任意固定版式的卡证票据的结构化识别能力。产品通过预学习智能结构化建立键值对应关系,也可由客户自主建立键值对关系定制模板,提升信息数据的提取和录入效率。可用于政事业务办理、特殊票据核销、行业表单定制等场景。

什么是键值对(KV) ?设置键值对应注意哪些事项?

键值对 (key:value) 是一种简单的对应关系,键后面对应着相应的值。传 Key 适用于相同版式或相同 Key 情况下的不同图片,可将其值传入以对后续传入的图片做 Value 匹配和矫正。n锚点字段设置建议如下:
字段内容:固定不变;对于不同锚点字段,文字不会重复出现。
数量:不做限制,根据业务需要进行设置;
位置:无需固定不变;均匀分布(尽量分散在图片四角);与识别字段之间有一定的分隔距离。

常见的键值(Key)有哪些?

智能结构化产品经过5亿+版式与字段预训练,为无 Key 的 Value 值预设值的键值有:标题(例如:驾驶员证 订购单)、日期(例如:时间 时间段 开票日期 交货时间)、金额(例如:金额小写、总价、金额大写)、号码(例如:证书号 票号 电话)、证字号(例如:证字第 字证号)、机构(例如:商家名称 公司名 公司)、姓名(例如:名字 英文姓名)、商品名称(例如:名称)、性别、地址、company(英文下的公司名)数量、规格(例如:产品规格)等。

传入的图片应注意哪些事项?

传 Key 适用于相同版式或相同 Key 情况下的不同图片,推荐识别输入图片的前置条件如下:
单行文本高度大于图片高度 1/40
图片中的文字清晰,肉眼可辨认
图片默认缩放尺寸:1500 * 1000
图片格式为:JPG、JPEG、PNG、BMP
全文不超过 2000 字

支持的语言与文字样式有哪些?

智能结构化是针对不同识别区内容类型进行专项优化的识别模型,本阶段产品标准印刷体(支持中英文)。
更多关于文字识别的问题,您可以查看 文字识别常见问题说明