腾讯AI Lab斩获知识图谱顶级赛事KBP 2017世界冠军

感谢阅读腾讯AI Lab微信号文章,恭喜知识图谱团队首次出战KBP大赛就获得实体发现与链接任务三语总分第一名好成绩!

美国国家标准与技术研究院(NIST)主办的2017年国际知识图谱构建大赛(Knowledge Base Population,简称KBP)结果近日揭晓,腾讯AI Lab首次参赛,斩获实体发现与链接(Entity Discovery and Linking Track,EDL)任务冠军。KBP大赛始办于2009年,是国际上影响力最大、水平最高的知识图谱领域赛事,此次夺冠体现了腾讯在知识图谱、语义理解等技术领域的强劲技术实力。

实体发现与链接任务三语总分前十位排名表(各队伍为匿名)

知识图谱是试图结构化人类知识的技术,一般通过描述实体属性以及建立实体和实体之间的关系来实现。当前,自然语言处理的很多任务都需要知识图谱的支持, 比如问答系统中的query语义理解。举个例子,如果你查询「86版西游记主演有哪些?」,要完整理解这句话,第一步先理解「西游记」这个实体及其类别,这个任务叫实体发现,就是识别出「西游记」是一部电视剧。第二步要解决实体的歧义性,因为知识图谱包含了各个版本的「西游记」,实体链接的任务就是要根据查询里的上下文,例如这里的「86版」,把「西游记」链向知识图谱中正确的那一版「西游记」,也就是1986年上映的「西游记」。

顶级国际赛事展现技术构架 深度学习构建领先语义理解模型

实体发现与链接是KBP赛事的核心任务,需要从目标文本中识别出实体,并把它们链接到已有的知识库上,具有很高的技术挑战性,任务针对中文、英文、西班牙文三种语言,腾讯获得三语实体发现与链接总分第一名,单语上的指标分别是中文和西班牙文两项第一、英文第二。比赛历来受到学术界和工业界的广泛关注,本次任务共24支队伍参加,包括IBM、美国卡耐基梅隆大学和美国伊利诺伊大学香槟分校等国际一流科研机构,及阿里巴巴、北京邮电大学和浙江大学等国内知名企业及院校。

本次比赛中,腾讯AI Lab在目前业界领先的EDL架构中引入了篇章理解模型和关联图模型。篇章理解模型采用深度学习架构,通过大规模数据的训练能够更精准的理解篇章的语义;关联图模型是将整篇文章的所有重要信息一起建模到一个图结构当中,整体求解以达到全局最优。

自建知识图谱TopBase 未来延伸到自然语言深度理解力

知识图谱是自然语言处理领域的核心技术,目前腾讯AI Lab建设了一个名叫TopBase的知识图谱,目前涵盖50多个领域如人物、音乐、影视、体育、诗词等,亿级实体,10亿级三元组,并已广泛应用到天天快报、微信看一看及微信搜索,和腾讯云小微等业务。

TopBase知识示意图

机器学习、计算机视觉、语音识别和自然语言处理是腾讯AI Lab的四大基础研究方向,在此研究基础上与腾讯业务与合作伙伴需求结合,落地到内容、游戏、社交和平台型AI四大应用上。

知识图谱所属的自然语言处理(NLP)领域,腾讯AI Lab还着重于问答、对话、文本生成、自动摘要和机器翻译方面的核心研究,并与语音识别和计算机视觉领域进行跨界应用,如同声传译和图片描述生成等技术。最终的目标是让机器更好的理解并生成文字内容,提升理解、决策和创造力,最终能与人类通过自然语言进行交流。

原创声明,本文系作者授权云+社区-专栏发表,未经许可,不得转载。

如有侵权,请联系 yunjia_community@tencent.com 删除。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏吉浦迅科技

(图解)人工智能的黄金年代:机器学习

Lady我在整理一些关于Deep learning方面的学习资料,看到好文章总是忍不住想跟各位分享。这次将系统地介绍深度学习的前世今生,文章很有趣,但也很长,将...

36815
来自专栏人工智能头条

深度学习 vs 概率图模型 vs 逻辑学

19512
来自专栏人工智能头条

2015人工智能重大突破

1293
来自专栏量子位

想骗过人脸识别?一块钱就够了(附送几组骗AI的方法+论文)

舒石 李林 编译整理 量子位 出品 | 公众号 QbitAI 人脸识别越来越常见,今年春运已经能刷脸进站,iPhone的相册就能用人脸分类照片,社交网站上能根据...

4658
来自专栏IT派

NLP之Wrod2Vec三部曲

N o . 1 基础篇 一.前言 伴随着深度学习的大红大紫,只要是在自己的成果里打上deep learning字样,总会有人去看。深度学习可以称为当今机器学习...

2755
来自专栏邵宗文的专栏

机器学习实战

本次很荣幸能邀请到邵宗文为我们带来《机器学习实战》主题分享。他有10多年运营开发、海量运维和架构规划经验,精通海量服务的架构设计和自动化运维建设,目前专注于大数...

2451
来自专栏新智元

【谷歌草绘RNN瞄准超级AI】源自壁画的飞跃,AI 学会归纳抽象概念

【新智元导读】人类自从开始在洞穴的岩壁上画出简单的草图,认知能力就产生了飞跃——归纳抽象的能力大大提高。现在,谷歌的 Magenta 项目也在致力于这一研究。名...

3049
来自专栏人工智能头条

如何成为一名对话系统工程师

1293
来自专栏大数据文摘

​AI大事件 | 人工智能检测自杀倾向,三星收购AI公司

1603
来自专栏专知

机器学习是“炼金术”?

1386

扫码关注云+社区