前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >腾讯数平精准推荐|斩获第14届国际文档分析与识别竞赛四项冠军

腾讯数平精准推荐|斩获第14届国际文档分析与识别竞赛四项冠军

作者头像
腾讯大数据
发布2023-03-03 14:12:06
7260
发布2023-03-03 14:12:06
举报

上周双十一全民狂欢节,当大家纷纷在剁手买买买的时候,腾讯数平精准推荐团队也发生了一件大事。

北京时间11月9日,OCR领域的奥斯卡盛会——第14届国际文档分析与识别大会(ICDAR)在日本京都召开,揭晓了2017年ICDAR竞赛结果并颁发获奖证书。

腾讯数平精准推荐团队自研了「时空上下文感知的OCR深度学习算法」,在最受关注的“Robust Reading Competitions”中的“COCO-TEXT 端到端文本识别”、“医学文献图像文本检测”、“医学文献图像文本识别”、“医学文献图像端到端识别”任务上斩获四项冠军。与往届数据集公开后的非正式竞相刷榜不同,ICDAR官方认证的正式竞赛采用全新的数据集,赛期内不公布参赛团队信息,且只允许提供一份结果,堪称是OCR领域的“华山论剑”,本次也是腾讯数平精准推荐团队首次出征ICDAR官方认证竞赛。

(图一) ICDAR 2017 获奖证书

到底什么是【ICDAR】?

国际文档分析与识别大会ICDAR( International Conference on Document Analysis and Recognition)是由国际模式识别协会IAPR(International Association of Pattern Recognition)举办的模式识别、计算机视觉、图像处理领域最为重要的国际学术会议之一。ICDAR专注于文本领域的识别与应用,每两年举办一次,自1991年第一届开始,至今已经成功举办了十四届。自从2003年大会开始设立“Robust Reading Competitions”以来,该竞赛就成为了评测和检验自然场景/网络图片/复杂视频文本自动提取与智能识别最新技术研究进展的最为重要的国际赛事及标准,在国际模式识别、文档分析与识别等领域具有重要的影响力。同时该竞赛由于其较高的技术难度,以及强大的实际应用性,多年来一直是各大科研院校、科技公司关注竞逐的焦点。截止目前,已经有89个国家的3500多支队伍在ICDAR数据集参加过竞逐(图二),其中Google、微软、腾讯、阿里巴巴、百度、三星、商汤、海康等科技公司都取得过不错的成绩,竞赛中涌现出的许多方法都对OCR技术的发展起到了强大的推动作用。

(图二) 参赛队伍数量统计

今年的“Robust Reading Competitions”,同样吸引了国内外众多的工业界、学术界的注意力,包括腾讯、海康、三星、英特尔、中科院、港大等都有参与该竞赛。数平精准推荐团队参加了其中的两项极有挑战性的竞赛任务,分别是:

1、COCO-TEXT

(Challenge on COCO-TEXT)

该项竞赛采用的数据集COCO-TEXT,选自Microsoft COCO (Common Objects in Context)数据集,是目前该领域最大的场景文本检测与识别数据集,包含4.4万张训练图片、1万张验证图片和1万张测试图片。图片主要由复杂的日常场景图片组成,数据规模、检测与识别难度均远超前几届竞赛,竞赛图片如图三所示。

数平精准推荐参赛结果: 端到端第一, 识别第二,检测第四。

(图三) COCO-TEXT 示例图片

2、DeText 

(Challenge on Text Extraction from Biomedical Literature Figures)

该项竞赛主要目的在于评测OCR算法对于医学文献中插图上的文本检测与识别能力,主要难点在于医学文献插图上文本布局复杂、字体较小、符号复杂以及医学单词复杂等,部分竞赛图片如图四所示。

数平精准推荐参赛结果: 端到端、检测、识别三项第一。

(图四)DeText  示例图片

数平精准推荐团队(Tencent Data Platform Precision Recommendation, Tencent-DPPR)是腾讯内部一支致力于实时精准推荐、海量大数据分析及挖掘等领域技术研发与技术落地的专业技术团队。团队在文本识别领域上已经深耕细作多年,自研的基于深度学习方法的文本检测与识别技术在往届ICDAR竞赛数据集上也曾多次刷新世界纪录。相关技术在公司内部众多产品中得到使用,例如:腾讯慧眼、手Q看点、话题圈、天御、社交广告等业务,尤其在广告推荐的场景中,通过OCR 技术对广告的素材创意进一步的识别和理解,大幅提升了用户点击率预估的效果。

后续我们将通过TEG《科技云端》专业号,在11月底相继推出系列文章,包括检测篇、识别篇、数据篇、系统篇等,全方位介绍数平精准推荐文本识别技术以及ICDAR2017参赛算法细节,敬请期待!

公众号

tencentbigdata

看到这里的都是真爱❤

数据运营实战(一):细分目标人群,结合用户画像的实践

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2017-11-14,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 腾讯大数据 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
文字识别
文字识别(Optical Character Recognition,OCR)基于腾讯优图实验室的深度学习技术,将图片上的文字内容,智能识别成为可编辑的文本。OCR 支持身份证、名片等卡证类和票据类的印刷体识别,也支持运单等手写体识别,支持提供定制化服务,可以有效地代替人工录入信息。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档