首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

知识图谱下半场机遇

以下整理自复旦大学知识工厂肖仰华教授的PPT:

应对策略分为三个方面:知识表示、知识获取和知识应用。

知识表示:

知识图谱的过程、时空、多模态语义增强

知识图谱与其他知识表示的协同机制与方法

知识图谱的个性化表示

知识获取:

低成本知识获取机制与方法

多粒度知识获取

大规模尝试获取与理解

复杂知识获取机制与方法

知识应用:

知识图谱应用透明化

知识引导下的下一代机器学习

基于知识图谱的可解释人工智能

如果我们可以建一个词汇知识图谱,就可以把用户的故障诊断、描述,跟专家的规则匹配上,从而解决规则失配问题。再比如,知识图谱和概率图模型也可以联姻。

实现大规模符号接地、构建多模态知识图谱,实现机器跨模态理解,提升机器理解世界的水平,是实现认知智能的关键基础技术之一。

针对不同的角色,定制相应的图谱。考虑到图模型的普适性,可以定制不同的权重,以体现不同角色对不同知识的认知程度。

很多时候强监督代价非常大,比如要耗费大量人力来标注。但是弱监督,比如采用规则、字典或者知识库、跨语言这种弱标注,成本就廉价得多。还有一个非常重要就是隐式众包。

注重多粒度知识获取,现在很多知识获取还是单一粒度,很多领域需要在不同粒度获取知识来支撑不同级别的应用。比如在司法实践,同样一个法条,可以在法条级别解决问题,有的时候还需要把它变成规则,甚至进一步细化变成刑罚要件。

在知识获取方面我们大力开展复杂知识获取方面的研究工作。现在句子级别的知识抽取已经能够做到90%以上的准确率,没什么难度。现在难的是文档级的知识获取。我们现在很多工作中,需要从海量文档中抽取知识,比如手册、标准、规范等等。

文档级信息抽取。文档信息抽取旨在从现有的文档中获取文档的结构化知识。相较于传统的信息抽取,基于文档的信息抽取需要结合文档自身的结构,书写风格,和组织形式进行一定的迁移。业务文档结构化迫切需要从句子级别抽取发展到篇章级别抽取。

当前的关系抽取只能有效浅层文本特征描述的关系实例,难以应对需要推理的关系抽取,业务文档结构化迫切需要基于浅层文本特征的信息抽取到基于深度推理的信息抽取。

发展领域知识的自主学习技术,让机器自主的学习出schema,让机器自主的获取知识,让用户零参与。将来用户只要支付成本,指定领域文档地址和数据入口,机器就能实现针对数据和文档的语义搜索和智能推荐,就能实现精准的知识问答。

目前机器学习还是一切从零开始学,这是一个低效的方式,应该把知识加进去。不管是来自于机器学习模型沉淀出的知识,还是专家知识,都应该利用符号知识来增强机器学习,这样才能突破当前机器学习面临的一些瓶颈。

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20201128A01EZR00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券