有奖调研

常见问题

最近更新时间:2021-04-02 10:51:18

自定义模板 OCR 具备什么能力?应用场景有哪些?

自定义模板 OCR 基于业界领先的深度学习技术和图像检测技术,提供针对任意固定版式的卡证票据的结构化识别能力,产品可由用户建立键值对应关系自主定制模板,提升信息数据的提取和录入效率。可用于政事业务办理、特殊票据核销、行业表单定制等场景。

什么是锚点字段?设置锚点字段应注意哪些事项?

锚点字段是相同版式的不同图片中位置和内容固定不变的字段,可将其框选作为图片的锚点,以对后续传入的图片做模板匹配和矫正。
锚点字段设置建议如下:

  • 数量:越多越好,建议≥5个。
  • 位置:固定不变;均匀分布(尽量分散在图片四角);与识别字段之间有一定的分隔距离。
  • 排版格式:单行、水平方向排列的文字区域;区域中包含文字数≥2个。
  • 字段内容:固定不变;对于不同锚点字段,文字不会重复出现。

自动识别的锚点内容如有错误或是文本框不贴合文字,需要手动修改正确。

什么是识别字段?设置识别字段应注意哪些事项?

识别字段是图片中需要进行识别的字段,可通过框选及命名构建键值对应关系,用于对后续传入的相同版式图片的相同位置内容进行结构化识别。
识别字段设置建议如下:

  • 位置:固定不变;与锚点字段之间有一定的分隔距离。
  • 框选区域:需要考虑到后期该字段可能产生的偏移情况,应足够宽泛,能涵盖所有样本中该字段的位置边界。
  • 排版格式:水平方向排列的文字区域。

常见字段类型有哪些?

字段类型是指针对不同识别区内容类型进行专项优化的切片识别模型,常见字段类型有标准印刷体(支持中英文)、小写金额、大写金额、日期、纯数字等。

目录