产品简介

最近更新时间:2022-01-18 15:56:12

产品介绍

随着办公数字化进程的加快,能够快速、精准、自动地从指定文档对象中获取文本结构化的信息成为办公环境数字化中的关键一环,办公文档还原基于业界领先的深度学习技术和图像检测技术,集高精度中英文识别、智能版面还原、全文排版输出、表格识别等多功能为一体,针对办公场景下常见的各类文档,如论文、合同、书籍、指南、幻灯片等,支持图片、表格、文本、分割线等视觉元素的相关属性输出,对文档信息进行提取,提升信息电子化录入存档的效率。

产品功能

智能版面分析

针对办公场景下常见的各类文档,如论文,合同,书籍,手册,指南,幻灯片,行业报告等,进行版面智能分析和输出,实现元素还原,位置还原,内容还原,顺序还原。支持多栏,内容混排,多语种(中英)等复杂版式,支持图片、表格、文本、分割线等视觉元素的相关属性输出。

关键属性抽取

支持文档关键属性快速抽取,可用于文档归档等场景。支持的关键属性包括文章标题,章节号,图片,表格,以及关联题头、题注等。

全文排版输出

支持图片、表格、文本按照阅读顺序和段落顺序输出,便于用户对于识别结果进行二次编辑。支持全文排序,支持分栏输出、段落输出。

高精度文本识别

在通用印刷体识别能力的基础上,针对办公文档场景新增了中英文高频字体、文字颜色、字号大小等识别功能,进一步提升文档还原的产品体验。

表格识别

支持文档中的常规表格、无线表格、多表格的检测和识别,并做提取还原,同时返回每个单元格的文字内容。

产品优势

高精度

本产品基于深度学习技术和图像检测技术,常见文档的还原准确率业界领先。

多功能

本产品集高精度中英文识别、智能版面还原、全文排版输出、表格识别等各接口功能为一体,统一输出上述能力,提升产品易用性。

完备性

本产品适用于各类办公场景下的常见文档,如论文、合同、书籍等,大幅度提升电子化录入存档的效率。

应用场景

企业文档管理

针对办公场景的各类文档,如论文、合同、行业报告、产品文档、书籍、档案等,提供高精度的文档还原能力。 支持返回图片、表格、文本的位置和信息,实现精准还原,极大程度上方便了用户对各类企业文档的管理。

目录