腾讯数平精准推荐|斩获2017年第14届国际文档分析与识别竞赛四项冠军

上周双十一全民狂欢节,当大家纷纷在剁手买买买的时候,腾讯数平精准推荐团队也发生了一件大事。

北京时间11月9日,OCR领域的奥斯卡盛会——第14届国际文档分析与识别大会(ICDAR)在日本京都召开,揭晓了2017年ICDAR竞赛结果并颁发获奖证书。

腾讯数平精准推荐团队自研了「时空上下文感知的OCR深度学习算法」,在最受关注的“Robust Reading Competitions”中的“COCO-TEXT 端到端文本识别”、“医学文献图像文本检测”、“医学文献图像文本识别”、“医学文献图像端到端识别”任务上斩获四项冠军。与往届数据集公开后的非正式竞相刷榜不同,ICDAR官方认证的正式竞赛采用全新的数据集,赛期内不公布参赛团队信息,且只允许提供一份结果,堪称是OCR领域的“华山论剑”,本次也是腾讯数平精准推荐团队首次出征ICDAR官方认证竞赛。

(图一) ICDAR 2017 获奖证书

到底什么是【ICDAR】?

国际文档分析与识别大会ICDAR( International Conference on Document Analysis and Recognition)是由国际模式识别协会IAPR(International Association of Pattern Recognition)举办的模式识别、计算机视觉、图像处理领域最为重要的国际学术会议之一。ICDAR专注于文本领域的识别与应用,每两年举办一次,自1991年第一届开始,至今已经成功举办了十四届。自从2003年大会开始设立“Robust Reading Competitions”以来,该竞赛就成为了评测和检验自然场景/网络图片/复杂视频文本自动提取与智能识别最新技术研究进展的最为重要的国际赛事及标准,在国际模式识别、文档分析与识别等领域具有重要的影响力。同时该竞赛由于其较高的技术难度,以及强大的实际应用性,多年来一直是各大科研院校、科技公司关注竞逐的焦点。截止目前,已经有89个国家的3500多支队伍在ICDAR数据集参加过竞逐(图二),其中Google、微软、腾讯、阿里巴巴、百度、三星、商汤、海康等科技公司都取得过不错的成绩,竞赛中涌现出的许多方法都对OCR技术的发展起到了强大的推动作用。

(图二) 参赛队伍数量统计

今年的“Robust Reading Competitions”,同样吸引了国内外众多的工业界、学术界的注意力,包括腾讯、海康、三星、英特尔、中科院、港大等都有参与该竞赛。数平精准推荐团队参加了其中的两项极有挑战性的竞赛任务,分别是:

1、COCO-TEXT

(Challenge on COCO-TEXT)

该项竞赛采用的数据集COCO-TEXT,选自Microsoft COCO (Common Objects in Context)数据集,是目前该领域最大的场景文本检测与识别数据集,包含4.4万张训练图片、1万张验证图片和1万张测试图片。图片主要由复杂的日常场景图片组成,数据规模、检测与识别难度均远超前几届竞赛,竞赛图片如图三所示。

数平精准推荐参赛结果: 端到端第一, 识别第二,检测第四。

(图三) COCO-TEXT 示例图片

2、DeText

(Challenge on Text Extraction from Biomedical Literature Figures)

该项竞赛主要目的在于评测OCR算法对于医学文献中插图上的文本检测与识别能力,主要难点在于医学文献插图上文本布局复杂、字体较小、符号复杂以及医学单词复杂等,部分竞赛图片如图四所示。

数平精准推荐参赛结果: 端到端、检测、识别三项第一。

(图四)DeText 示例图片

数平精准推荐团队(Tencent Data Platform Precision Recommendation, Tencent-DPPR)是腾讯内部一支致力于实时精准推荐、海量大数据分析及挖掘等领域技术研发与技术落地的专业技术团队。团队在文本识别领域上已经深耕细作多年,自研的基于深度学习方法的文本检测与识别技术在往届ICDAR竞赛数据集上也曾多次刷新世界纪录。相关技术在公司内部众多产品中得到使用,例如:腾讯慧眼、手Q看点、话题圈、天御、社交广告等业务,尤其在广告推荐的场景中,通过OCR 技术对广告的素材创意进一步的识别和理解,大幅提升了用户点击率预估的效果。

后续我们将通过TEG《科技云端》专业号,在11月底相继推出系列文章,包括检测篇、识别篇、数据篇、系统篇等,全方位介绍数平精准推荐文本识别技术以及ICDAR2017参赛算法细节,敬请期待。

文章来自:TEG云端专业号

原创声明,本文系作者授权云+社区发表,未经许可,不得转载。

如有侵权,请联系 yunjia_community@tencent.com 删除。

编辑于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏京东技术

京东AI研究院在CVPR 2018 LIP 全球竞赛中荣获两项冠军

1993
来自专栏专知

【微软亚研130PPT教程】强化学习简介

【导读】近年来,强化学习特别是深度强化学习在棋类、视屏游戏、机器人控制等问题上取得了极大的成功,成为人工智能研究的热点。 微软亚洲研究院的秦涛研究员在报告《强化...

1443
来自专栏腾讯高校合作

犀牛鸟人物丨专访刘偲老师:图像之美像素级语义理解研究

2103
来自专栏大数据

做全球最大的司法信息资源库——中国司法大数据服务网上线记

11月30日上午,最高人民法院召开中国司法大数据研究院专题研究暨中国司法大数据服务网上线新闻发布会,最高人民法院信息中心主任许建峰介绍了中国司法大数据研究院专题...

2150
来自专栏大数据文摘

AI教父Geoff Hinton和深度学习的40年

因为伤了背,Geoff Hinton已经站着工作了12年,似乎巧合地迎合了现在“站立工作”的这股风潮。

1002
来自专栏量化投资与机器学习

【独家前沿策略】机器学习应用投资组合系列(代码+论文)

南洋理工大学计算机系和米兰理工数据挖掘研究组的科学家发现,虽然公众情绪已经被认为是股市预测的关键因素,但近十年来在利用公共情绪来解决资产配置问题的理论方面,学术...

1272
来自专栏大数据文摘

Deep Learning:from AI to True-AI(34PPT)

21011
来自专栏数说工作室

量化投资之资本资产定价模型(CAPM)

量化投资之资本资产定价模型 (CAPM) 目录 一、前言 二、CAPM模型 1. 切点组合、分离定理与市场组合 2. 资本市场线 ...

45212
来自专栏量化投资与机器学习

【Python量化投资】拟合具有非平稳特征的神经网络对股票进行预测

对建筑行业的股价进行分析预测 一、建筑行业规模 二、建筑行业市值前六公司 中国建筑 - 601668.SH 中国交建 - 601800.SH 中国中铁 - ...

2117
来自专栏AI科技评论

赛后跟踪:如何在 ImageNet 比赛中获得冠军?

近两个月,国内团队先后在全球权威的人脸检测评测平台 FDDB 和全球自动驾驶算法公开排行榜 KITTI 以及 Cityscapes 上取得非常好的成绩,这在一定...

3595

扫码关注云+社区