记者 | Jane
责编 | 琥珀
出品 | AI科技大本营(id:rgznai100)
近年来,随着人们对 AI 认知能力的积极探索,知识图谱因其表达能力强、拓展性好,基于知识进行推理等优势得到了学界与业界的高度关注。知识图谱,旨在描述客观世界概念、实体、事件及其之间关系,具备可解释性,而且可以用于解决复杂决策问题。这也意味着通过深度学习与知识图谱的结合,模型底层特征空间与人类自然语言之间巨大的语义鸿沟问题有望得以解决。在大数据和机器学习两大引擎下,大规模知识图谱的自动化构建成为现实,这就加快了知识图谱的落地与应用。
传统意义上,知识图谱可以划分为通用知识图谱和领域知识图谱。例如,国外的谷歌搜索引擎和国内的百度搜索引擎,这类通用领域知识图谱是最先被大家熟知的应用;而场景的不断丰富、需求不断增多、用户对体验与品质的要求不断提高,各行各业都亟需构建领域知识图谱。
那么,从趋势到实际需要,知识图谱已经取得了哪些学术与技术成果,产业与应用发生了哪些变化?当下知识图谱领域最关注的问题又是什么?未来,知识图谱又有哪些发展前景?近日,AI科技大本营采访到了东南大学教授、博士生导师,东南大学认知智能研究所所长漆桂林。
漆桂林认为,目前知识图谱整个领域最关注的问题还是如何能够高效、低成本构建知识图谱,而这个问题对于研究人员来说,仍是一个非常大的挑战,比如现在大家都在关注如何在少量甚至无标注场景下进行知识图谱构建。
漆桂林表示,近两年知识图谱研究有一些值得关注的成果,比如:
与此同时,这些关键技术的应用也有一些突破性的进展,尤其是在知识抽取和知识融合方面:一是人机交互的商业化系统的出现,二是关于人机交互的信息抽取和知识融合的学术论文也开始。
在他看来,知识图谱表示学习与推理也取得了很多进展,大家开始研究知识表示学习在多模态数据上的应用,即结合文本、知识图谱、图像或者视频的知识表示学习,以及基于知识表示学习的推理。
知识图谱从以前研究与产业界脱钩,到现在领域知识图谱成为研究的重点,开始面向解决实际的问题。比如最近司法知识图谱的构建出现了不少研究成果。另外,知识图谱用于解决问答、推荐系统、图像理解方面的论文也不断在增加。
同时,知识图谱在不同行业也得到了广泛应用,领域知识图谱成为企业的迫切需求。例如,金融领域中的信用评估、风险控制、反欺诈问题;医疗领域中的智能问诊问题。从通用知识图谱到领域知识图谱,知识图谱开始在越来越广泛、复杂的场景中落地并解决实际问题。
“在医疗、电商、金融、军工、电力、司法、教育、公安、石油这几个领域知识图谱已经落地并且取得了突出成果。”漆桂林谈到。知识图谱可以帮助这些领域的公司或研究机构更好地处理多源异构数据,也就是说可以提供一个统一数据模型并且可以灵活地集成和关联这些数据,对这些数据进行关联分析。
“知识图谱的产学研需要有一个整体规划,这也是我一直在实践的。”漆桂林表示。
在他看来,首先需要了解产业界对知识图谱的需求,知道知识图谱可以解决什么应用问题,带来什么价值。
其次,通过了解知识图谱落地的挑战,确定知识图谱的研究课题。
从短期和长期来看,短期课题是要解决产业界急迫的问题,比如少量标注情况下的信息抽取方法的研究;而长期课题是面向三年之后可能对知识图谱落地有用的技术,比如无标注场景下的信息抽取技术。
最后,让知识图谱技术可以快速普及。为了进一步贯彻知识图谱的产学研,漆桂林还联合学界、工业界的专家共同成立了 OpenKG 联盟。
漆桂林,东南大学教授,博士生导师,东南大学认知智能研究所所长。现任中国中文信息学会语言与知识计算专业委员会副主任和中国科学技术情报学会知识组织专业委员会副主任。2006年,漆教授获得英国贝尔法斯特女皇大学计算机博士学位,导师为人工智能界著名专家 Weiru Liu 教授。2006年8月至2009年8月在德国Karlsruhe大学AIFB研究所做博士后研究,导师为语义 Web 界国际知名专家Rudi Studer教授。
目前,漆桂林的研究方向为:知识图谱的表示和推理、通用知识图谱构建、情感分析、智能问答、关系抽取、多模态图像处理。
在知识图谱的表示和推理,知识图谱融合和更新,通用知识图谱引擎构建,以及高效、低成本构建知识图谱方面取得了一些成果,包括:
作为本次杭州 CTA 大会知识图谱论坛的出品人,漆桂林表示:“我希望跟各位嘉宾交流他们在知识图谱产业化落地过程中遇到的主要技术挑战有哪些,这些技术挑战可以为高校的研究带来什么好的课题。”
他还表示,无论是对知识图谱前沿技术研究还是对知识图谱产业化落地感兴趣的人,都值得来参加。与会者在本次论坛将了解知识图谱最新技术进展与知识图谱应用价值,知识图谱落地的技术挑战,如何解决这些挑战,本次论坛的一个目的就是探讨知识图谱下一步发展的道路。