知识图谱中的推理技术及其在高考机器人中的应用

本文来自东南大学教授漆桂林在携程技术中心主办的深度学习Meetup中的演讲内容,介绍了知识图谱中的推理技术及其在高考机器人中的应用。

随着信息化、互联网化,如何在海量的信息中获取核心的知识体系、知识图谱,并基于知识图谱理清海量信息的关系及结构,显得越来越重要。

本文简明地讲述了知识图谱的概念,回顾了知识图谱的历史,研究了知识图谱中的推理技术及其在高考机器人中的应用,希望能做出辅助学生学习的智能机器人。

什么是知识图谱

知识图谱是一种图数据模型组织的知识库,节点为实体或者概念,边为实体或者概念间各种关系。知识图谱为实现人工智能提供了常识知识和领域知识。

知识图谱的历史

知识图谱来源于知识工程。知识工程的历史回顾,可以追溯到六十年代Semantic Nets。到了八十年代专家系统,但由于知识瓶颈问题,在90年代受到的关注越来越小。Yahoo前首席科学家Ronald J. Brachman研究的KL-One系统是为了把Semantic Nets形式化。

Semantic Nets重新红火是2000年左右,随着Semantic Web的提出,智能化的搜索——语义搜索被认为是下一代搜索引擎,而Semantic Nets是语义搜索的关键。从2010年开始,Google提出Knowledge Graph,使得知识工程受到了业界和学术界的广泛关注。

知识图谱的逻辑推理

知识图谱的推理跟本体是相关的。什么是本体?形式化的,对于共享概念体系的明确而又详细的规范说明。本体提供的是一种共享词表。或者说,就是一种特殊类型的术语集。只有把概念形式化,机器和人才能互动和理解。

比如,心脏是一种肌肉组织,是血液循环系统的一部分。心脏和肌肉组织是一种上下位的关系,和循环系统是部分与整体的关系。

本体的定义,有点像数据库schema的定义,但更灵活。本体间的关系可以用类表示。比如独奏音乐艺术家与艺术家之间有上下位的关系。上下位关系有传递性。另外我们有不相交的关系,一种东西不能既是火车又是汽车。蕴含的关系可以通过推理得出。

另外一个比较重要的逻辑推理是基于规则的推理,比如说产生式规则的推理。

基于统计的推理

结合统计推理,我们可以发现有些百科中的矛盾,大豆食心虫既是动物,又是植物。另外,与深度学习比较紧密的是表示学习(Representation Learning)。

表示学习的基本思想:用低维的向量空间将每个实体都表示到空间里面的某一个位置,从而可以利用空间中的距离来衡量实体之间的语义关系。E1,E2, … En代表所有实体,R1,R2, … Rn代表所有关系,故可以使用三维矩阵(张量)表示知识图谱。还有Path Ranking Algorithm,根据路径,预测人物之间的关系是否成立。

高考解题的应用

以空间推理为例。对于目前的大部分试题的图片,现有的单一的空间推理模型(RCC、CSD、ICD)不足以表达足够的空间关系。比如,美国与加拿大之间既存在拓扑关系,也存在方位关系。需将多种的空间推理模型结合,得到新的空间关系表示和推理模型。新的模型的表示、推理能力?应强于原有单一模型,但仍有待调研、测试。

空间推理模型需要扩展。

  1. 扩展表示方法。引入距离模型和其他空间模型(如上下左右的表示)。
  2. 扩展表示对象。动态对象的表示,线、点线面关系的表示,模糊对象的表示。

比如说,我们要分析地理岩层。我们要了解事实:石灰岩属于沉积岩,页岩属于沉积岩,规则:沉积岩越往下形成年代越早,同层沉积岩形成年代一致。用来预测分析岩层属于什么岩。

最后强调,知识图谱中的本体和规则是相当重要的。

演讲PPT下载:

知识图谱中的推理技术及其在高考机器人中的应用

携程技术中心深度学习Meetup系列:

本文由携程技术中心(微信公号ctriptech)童兰利整理,并经过演讲者本人确认和授权发布。 责编:周建丁(zhoujd@csdn.net)


原文发布于微信公众号 - 人工智能头条(AI_Thinker)

原文发表时间:2016-07-28

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏AI科技评论

国内首届中文人机对话技术评测赛果出炉,两项任务冠军团队都分享了哪些技术细节?|SMP 2017

AI科技评论按:近年来,人机对话技术受到了学术界和产业界的广泛关注。学术上,人机对话是人机交互最自然的方式之一,其发展影响及推动着语音识别与合成、自然语言理解、...

70210
来自专栏AI科技评论

哈工大秦兵:机器智能中的文本情感计算 | CCF-GAIR 2018

AI 科技评论按:2018 全球人工智能与机器人峰会(CCF-GAIR)在深圳召开,峰会由中国计算机学会(CCF)主办,雷锋网、香港中文大学(深圳)承办,得到了...

1562
来自专栏新智元

【免费】5本机器学习电子书推荐(附简介与下载)

【新智元导读】 这五本精心挑选的电子书,可以帮助你更全面地了解机器学习,掌握进入这个行业必备的技能。 需要注意的是,虽然有关机器学习的免费电子书成千上万,而且其...

40110
来自专栏IT派

干货 | 面试官是如何看出你机器学习水平的?

面试官如何判断面试者的机器学习水平? 首先这个问题问的很广。做机器学习方向很多,有些公司更偏重于数据挖掘,而有些更倾向于深度学习。同理,相对应的岗位有些偏重理...

4606
来自专栏AI研习社

面试官如何判断面试者的机器学习水平?

面试官如何判断面试者的机器学习水平? 首先这个问题问的很广。做机器学习方向很多,有些公司更偏重于数据挖掘,而有些更倾向于深度学习。同理,相对应的岗位有些偏重理论...

39311
来自专栏AI研习社

Kaggle 大神 Eureka 的高手进阶之路

作为全球首屈一指的数据科学、机器学习竞赛和分享平台,Kaggle 以其比赛多样、数据集全面、社群活跃的优势而备受推崇。从学生到上班族,Kaggle 的用户群体范...

42510
来自专栏大数据文摘

学界 | 马里兰大学研究:人脑神经网络的动态变化和声音感知

1783
来自专栏机器之心

让人工智能发明自己的语言:OpenAI语言理解研究新方向

选自OpenAI 作者:Igor Mordatch 等 机器之心编译 参与:李泽南、蒋思源、微胖、黄小天 在本文中,OpenAI 展示了自己的新研究,让人工智能...

3367
来自专栏AI科技大本营的专栏

AI Insight:有了深度学习就可以包打天下?你想多了

眼下深度学习是整个 IT 领域中最热门的技术之一。虽然它只是机器学习五大学派数十种算法之一,但从媒体关注度、论文发表数量和创业投资热度来说,在人工智能、数据科技...

33711
来自专栏PPV课数据科学社区

【观点】以“上大学分析”为例体验什么是数据挖掘

某社会机构,收集了大量的学生考大学的数据。该机构希望找出一些规律,以推动更多的学生考大学。该机构委托你来做这个分析工作,给出具体的可以推动更多学生考大学的建议。...

2734

扫码关注云+社区

领取腾讯云代金券