腾讯国际大赛再“亮剑”,腾讯云打开OCR技术场景应用新时代

11月9日,具有OCR领域的奥斯卡盛会之称的“第14届国际文档分析与识别大会(ICDAR)”,揭晓了2017 ICDAR竞赛结果。腾讯数平精准推荐团队首次出征便凭借自研的“时空上下文感知的OCR深度学习算法” 斩获四项冠军。

(ICDAR2017获奖证书)

OCR技术落地,给予全新解决方案

国际文档分析与识别大会(ICDAR)专注于文本领域的识别与应用,自2003年大会设立“Robust Reading Competitions”以来,该竞赛就成了评测和检验自然场景/网络图片/复杂视频文本自动提取与智能识别最新技术研究进展的最为重要的国际赛事及标准,竞赛中的诸多方法对OCR技术的发展具有强大推动力。高技术难度、强大实际应用性,也使该盛会受到科研院校、科技公司等的关注,至今已有89个国家的3500多支队伍参与。

(参赛队伍数量统计)

据了解,首次参与竞逐的腾讯数平精准推荐团队在文本识别领域上已深耕多年,自研的基于深度学习方法的文本检测与识别技术在往届ICDAR竞赛数据集上也曾多次刷新世界纪录。相关技术在腾讯内部多款产品成功应用,特别在广告推荐的场景中,通过OCR 技术深度识别和理解广告素材创意,大幅提升了用户点击率预估的效果。

腾讯优图OCR技术也早在ICDAR 2015大赛的场景文字识别和自然场景文本检测两项目中取得第一,并且,基于腾讯优图实验室的业界领先的核心能力,腾讯云将OCR文本识别和检测技术真正落地,深度介入印刷体和手写体存在的各种场景,给予行业流程繁琐、效率低下以及成本居高不下的全新解决方案。

智能解放生产力,助力行业标杆

OCR是人工智能里面非常重要的基础能力之一,对于传统行业,在优化业务流程、解放生产力和降低企业成本方面,实效凸显。而受众群体极广、业务量相对较大、频次较高的物流场景对这一技术的追求,显得迫切,纷纷通过腾讯云依托优图实验室的OCR技术给予的全新解决方案成就行业标杆。

物流行业劳动密集型的属性,在顺丰身上比较明显。据悉,目前顺丰拥有将近20万地面小哥,平均每天传递将近900万个包裹和商务信件,这在以前需要顺丰雇佣大量输单员手动输入运单信息。和腾讯云战略合作之后,凭借其OCR技术全新解决方案,实现快速识别手写体和打印体的快递单,准确率高达91%。以往因容易认错而加大物流中的人力、物力和时间成本的潦草的手写寄件收件信息,也能够识别,正确率接近人工识别水平。最终,加上本身OCR技术的“7X24”服务能力,给予顺丰3小时内识别2000万张订单信息的业务效率,一定程度上也极大的提高了整体物流效率,而且不经人工,也一定程度上降低了用户隐私泄露的风险。

腾讯云与中国外运合作,依托优图实验室识别技术帮助解决企业效率问题,也是一个典型的智能实践案例。中外运是国际整合物流服务商,海外网络覆盖全球五大洲,其每年业务系统订单超过300万,而在传统作业方式下,人工识别、录入一笔单据需要3分钟。而通过应用OCR技术解决方案,识别单据仅需4秒,而且实现识别即入系统,效率提升45倍。据了解,除了单据录入,中外运在订舱委托、订舱确认件、提单样本、发票等环节都应用了这一技术,传统人力操作业务流程彻底变成自动化智能化,降低企业负担。

强大技术能力,支撑多场景应用环境

除了物流行业场景的天然需求,腾讯云依托优图实验室OCR技术给予的解决方案,还被广泛应用在金融、保险以及政府部门等行业组织场景中的证件识别,如身份证、驾驶证、行驶证、营业执照、车牌、名片等。据了解,该解决方案已支持英文数字识别,和超过9000个常用汉字的简繁体识别。针对身份证识别,其已支持身份证的正、反面识别,一次扫描即可识别所有字段,对于像倾斜、暗光、曝光、阴影等异常场景环境的识别,也能保障准确率。该解决方案还能通过自适应判别纠正技术,将身份证上的数字识别准确率提高到99.9%以上,而对印刷体名片,其能自动识别和定位姓名、手机号、QQ等字段,并实现30度以内的角度偏转,姓名字段与手机号码字段的自动识别准确率超过90%,领跑业界。

值得一提的是,传统的营业执照信息录入,要依赖人工对信息进行录入、处理和核对,存在信息录入错误、效率低等问题。上传营业执照便能自动识别名称、执照号等,支持核实与纠正识别的信息。避免繁琐的人工输入,同时又能提高注册和客服审核的效率与准确度。对营业执照存在的不同版本的字段分布差异以及执照图片质量差等问题,其定制研发的OCR检测识别引擎,识别准确率达到95%以上。

腾讯云打造的多场景智能识别解决方案,其本身不断优化升级的同时,还携手更多行业合作伙伴,通过技术赋能实现行业改革,提升整体行业效率,最终也将受惠于每一个人。

原创声明,本文系作者授权云+社区-专栏发表,未经许可,不得转载。

如有侵权,请联系 yunjia_community@tencent.com 删除。

编辑于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏华章科技

别吹牛,大数据精准广告并不靠谱

大数据目前已经成为整个IT界(包含Internet Technology 以及Information Technology)最热的词汇之一,似乎任何一个话题,只...

823
来自专栏AI科技大本营的专栏

CCAI | FDT-AI联合创始人兼CEO柳崎峰:金融机构的市场机遇与实践

香港智能金融科技有限公司联合创始人兼CEO柳崎峰 文/CSDN周翔 7 月 22 - 23 日,在中国科学技术协会、中国科学院的指导下,由中国人工智能学会、阿里...

3025
来自专栏VRPinea

VIVE X加速器公布第三批入选公司,推动全球AR/VR生态系统发展

3846
来自专栏灯塔大数据

为何说大数据精准广告并不靠谱?

? 一、大数据精准广告内涵 大数据目前已经成为整个IT界(包含Internet Technology 以及Information Technology)最热的...

3397
来自专栏数据科学与人工智能

回归算法在数据比赛使用场景

本文整理了14个天池、DataCastle、CCF竞赛中可使用回归算法处理的问题场景。 1 生活大实惠:O2O优惠券使用预测 随着移动设备的完善和普及,移动互联...

3386
来自专栏腾讯研究院的专栏

腾讯即通助理总经理冼业成:QQ大数据的特征和价值

大数据似乎在一夜之间迅速走红,它势不可挡地冲击着金融、零售等各个行业。云计算将如何改变计算的世界?未来将有怎样的应用前景?如何解决“信息孤岛”的问...

1975
来自专栏数据猿

数之联CTO方育柯:数据驱动下的制造降本与增效案例解析

1074
来自专栏数据猿

薪人薪事联合创始人吕恒:数据化是创业者对抗熵增的最佳实践

数据猿导读 在企业组织的发展过程中,人力资源是必不会少的一个环节,可以说,自打企业诞生之初就有各种人力资源的问题冒出来。企业发展的越快,无序化的问题就越多,熵增...

3008
来自专栏机器之心

业界 | 从12大领域盘点133家人工智能企业,精准提升产品与服务

选自Venture Beat 机器之心编译 参与:蒋思源 本文提供了 133 家人工智能企业,其中既有科技巨头又有新兴初创公司。本文希望能按类别给读者提供一个全...

2646
来自专栏镁客网

人工智能抢饭碗,未来怎么养活家庭? | 拔刺

1084

扫码关注云+社区