首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

合合信息智能文字识别服务平台亮相“1024程序员节”

本报记者 施露

近期,CSDN(中国开发者网络)第三届“1024程序员节”(简称“大会”)顺利举办,来自Linaro等开源组织的领导者和微软、腾讯、华为、合合信息等企业的技术专家接连登陆主论坛重磅活动《全体大会:2022技术英雄会》,与观众云端话科技。

怎样从数据中发现更多的价值,找到更实用的开发工具,是程序员群体重点关注的话题。合合信息智能创新事业部总经理唐琪受邀分享智能文档处理的技术优化方法及开源渠道介绍,获得了众多开发者的认可。

“在各种场景的实践中我们发现,单纯的文字识别不足以支撑更细致的文档处理需求,版面元素分析才是基础。”唐琪提到,文档处理过程中要重点关注对印章、logo、水印、页眉、二维码、公式等元素的检测,根据检测结果采取对应的版式分析方式,可得到更精准的识别结果。

智能文档处理技术本质上是把文档里的信息从载体中剥离出来,将其对接到其他系统,以数据的流转实现流程自动化的技术。典型场景如单据的自动审核,就是先对单据进行图像检测,从中提取所需信息并录入到系统里,经过结构化处理,“翻译”成机器能理解的内容后再进行自动判别,达到节省人工成本、提高工作效率的目的。

如何让已经接受过市场检验的技术产品惠及更多的开发者?技术服务的共享是促进科技创新的重要渠道。合合信息将在制造业、金融业、物流业等30个行业应用里打磨出的核心技术产品“智能文字识别服务平台”(简称“平台”)以SaaS的形式免费开放给个人开发者,助力使用者们低成本、高效率获取贴合个性化需求的定制模型。

受远程办公趋势发展和环保“无纸化”倡导的影响,社会对智能文档处理技术的需求不断增加。合合信息智能文档处理技术可支持全球超过50种主流语言的印刷体、手写体的高精度识别,以及增值税发票、出租车票等20多种票据的识别,这些通用识别、信息抽取能力被搭载于合合信息智能文字识别服务平台SaaS版中,并于大会上开放试用。

该平台提供了海量训练数据快速生成、自动化模型生成、完整的模型训练和测试等功能,具备低使用门槛、所需样本少、开发周期短的优势,使用者通过云端的简单操作,即可定制提取标准和非标准版式文档的结构化信息,仅需10张样本就可以开始训练。

(编辑 张钰鹏 孙倩)

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20221026A05KDI00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

相关快讯

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券