腾讯AI Lab斩获知识图谱顶级赛事KBP 2017世界冠军

谢阅读腾讯AI Lab微信号文章,恭喜知识图谱团队首次出战KBP大赛就获得实体发现与链接任务三语总分第一名好成绩!

美国国家标准与技术研究院(NIST)主办的2017年国际知识图谱构建大赛(Knowledge Base Population,简称KBP)结果近日揭晓,腾讯AI Lab首次参赛,斩获实体发现与链接(Entity Discovery and Linking Track,EDL)任务冠军。KBP大赛始办于2009年,是国际上影响力最大、水平最高的知识图谱领域赛事,此次夺冠体现了腾讯在知识图谱、语义理解等技术领域的强劲技术实力。

实体发现与链接任务三语总分前十位排名表(各队伍为匿名)

知识图谱是试图结构化人类知识的技术,一般通过描述实体属性以及建立实体和实体之间的关系来实现。当前,自然语言处理的很多任务都需要知识图谱的支持, 比如问答系统中的query语义理解。举个例子,如果你查询「86版西游记主演有哪些?」,要完整理解这句话,第一步先理解「西游记」这个实体及其类别,这个任务叫实体发现,就是识别出「西游记」是一部电视剧。第二步要解决实体的歧义性,因为知识图谱包含了各个版本的「西游记」,实体链接的任务就是要根据查询里的上下文,例如这里的「86版」,把「西游记」链向知识图谱中正确的那一版「西游记」,也就是1986年上映的「西游记」。

顶级国际赛事展现技术构架 深度学习构建领先语义理解模型

实体发现与链接是KBP赛事的核心任务,需要从目标文本中识别出实体,并把它们链接到已有的知识库上,具有很高的技术挑战性,任务针对中文、英文、西班牙文三种语言,腾讯获得三语实体发现与链接总分第一名,单语上的指标分别是中文和西班牙文两项第一、英文第二。比赛历来受到学术界和工业界的广泛关注,本次任务共24支队伍参加,包括IBM、美国卡耐基梅隆大学和美国伊利诺伊大学香槟分校等国际一流科研机构,及阿里巴巴、北京邮电大学和浙江大学等国内知名企业及院校。

本次比赛中,腾讯AI Lab在目前业界领先的EDL架构中引入了篇章理解模型和关联图模型。篇章理解模型采用深度学习架构,通过大规模数据的训练能够更精准的理解篇章的语义;关联图模型是将整篇文章的所有重要信息一起建模到一个图结构当中,整体求解以达到全局最优。

自建知识图谱TopBase 未来延伸到自然语言深度理解力

知识图谱是自然语言处理领域的核心技术,目前腾讯AI Lab建设了一个名叫TopBase的知识图谱,目前涵盖50多个领域如人物、音乐、影视、体育、诗词等,亿级实体,10亿级三元组,并已广泛应用到天天快报、微信看一看及微信搜索,和腾讯云小微等业务。

TopBase知识示意图

机器学习、计算机视觉、语音识别和自然语言处理是腾讯AI Lab的四大基础研究方向,在此研究基础上与腾讯业务与合作伙伴需求结合,落地到内容、游戏、社交和平台型AI四大应用上。

知识图谱所属的自然语言处理(NLP)领域,腾讯AI Lab还着重于问答、对话、文本生成、自动摘要和机器翻译方面的核心研究,并与语音识别和计算机视觉领域进行跨界应用,如同声传译和图片描述生成等技术。最终的目标是让机器更好的理解并生成文字内容,提升理解、决策和创造力,最终能与人类通过自然语言进行交流。

原创声明,本文系作者授权云+社区-专栏发表,未经许可,不得转载。

如有侵权,请联系 yunjia_community@tencent.com 删除。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏量子位

机器学习到底能替人干哪些工作?《科学》列出了8条评估标准

唐旭 编译整理 量子位 出品 | 公众号 QbitAI ? 对于AI会取代哪些人类工作的猜测,也许可以暂时停一停了。 最近,两位来自MIT和CMU的研究者在一篇...

4008
来自专栏数据科学与人工智能

【数据分析】Intel研究院院长吴甘沙:大数据分析师的卓越之道

吴甘沙 Intel中国研究院第一位“首席工程师” Intel中国研究院院长 ? 亲爱的各位同仁,各位同学,早上好。讲到大数据,就要问数据分析师应该做什么?所以我...

2485
来自专栏AI研习社

如何优雅地躲避学术地雷 | AI阅读研究所·第1期

策划 / 晋阳 编辑 / 吴璇 数字时代的今天,从各个渠道涌来的各种碎片化信息数不胜数。对于 AI 领域,每天会涌现一大波国内外的技术博文、论文、文档等等。 习...

3356
来自专栏吉浦迅科技

GPU 如何为机器学习带来革命性的变化

机器学习是当代最重要的计算机运算发展项目之一。 先进的机器学习技术使得人工智能出现爆炸性的发展,创造出新一波智慧应用和服务项目。 实时语音翻译、自动机器人、通过...

2768
来自专栏大数据文摘

为何机器学习识别声音还做不到像识别图片那么容易?

1584
来自专栏腾讯AI实验室的专栏

腾讯AI Lab斩获知识图谱顶级赛事KBP 2017世界冠军

感谢阅读腾讯AI Lab微信号文章,恭喜知识图谱团队首次出战KBP大赛就获得实体发现与链接任务三语总分第一名好成绩!

611
来自专栏智能计算时代

神经网络计算爆炸

深度挖掘的公司开始为特定应用定制这种方法,并花费大量资金来获得初创公司。 具有先进并行处理的神经网络已经开始扎根于预测地震和飓风到解析MRI图像数据的许多市场,...

3215
来自专栏一条二哈的AI成长路

人脸识别长篇研究

人脸识别(Face Recognition)是一种依据人的面部特征(如统计或几何特征等),自动进行身份识别的一种生物识别技术,又称为面像识别、人像识别、相貌识别...

63714
来自专栏AI科技评论

虽又击败了人类选手,但我们认为 OpenAI 的 5v5 DOTA AI 不过如此

AI 科技评论按:各位读者想必今天一睁眼就被「OpenAI 的人工智能在 DOTA 5v5 比赛中也打败了人类选手」的新闻刷屏了。OpenAI 开发的 DOT...

995
来自专栏华章科技

冯·诺依曼:论数学

作者:冯·诺依曼(John Von Neumann,1903-1957)美籍匈牙利人,数学家。

673

扫码关注云+社区