随着大数据的不断发展, BI从1.0报表时代,到注重可视化的2.0时代,再到降低数据分析门槛的智能BI 3.0时代,该领域为业务分析带来了技术上的变革。
今年亿信华辰发布的全新一代不用做表的智能BI——智问,是AI+BI最好的落地应用。你只需简单地输入或者语音提问一个问题,智问就会给你一个可视化的图表答案。
比如:你想了解xx医院今年的医疗收入,只需要对智问说 “xx医院的医疗收入”,就会瞬间把医院的数据呈现在你面前。
看起来好像很简单,如果数据是公开的,似乎任何一个者搜索引擎都可以实现。但是,如果进一步提问医疗收入的具体收入构成及比重,如果没有现成数据,搜索引擎是给不了答案的。如何解决这个问题,这时候就需要用到知识图谱技术了。
什么是知识图谱
知识图谱作为AI技术最重要基础设施之一,从概念上来说,知识图谱(Knowledge Graph)又称为科学知识图谱,在图书情报界称为知识域可视化或知识领域映射地图,是显示知识发展进程与结构关系的一系列各种不同的图形,用可视化技术描述知识资源及其载体,挖掘、分析、构建、绘制和显示知识及它们之间的相互联系。简单来说,知识图谱反应了现实生活中各个知识体之间的联系和关系。下图是一个典型的知识图谱:
一个知识图谱通常来说由三个部分组成,包括实体、关系和三元组集合。其中实体定义的是自然界中真实存在的东西,关系定义实体与实体之间的联系,三元组集合由多个三元组构成,三元组的基本形式主要包括实体1、关系、实体2和概念、属性、属性值等,实体是知识图谱中的最基本元素,不同的实体间存在不同的关系。概念主要指集合、类别、对象类型、事物的种类,例如人物、地理等;属性主要指对象可能具有的属性、特征、特性、特点以及参数,例如国籍、生日等;属性值主要指对象指定属性的值,例如中国、1988-09-08等。
通过定义这些概念,我们就可以轻易地定义出各个实体之间的关系,并根据这些关系做出一些深入的分析。
亿信智问中的知识图谱
还是之前的那个问题,在智问中,我们可以定义这样一些三元组,将医疗收入相关的组成部分和医疗收入有机关联起来。然后我们就可以根据定义的关系直接问出字段中隐含的业务知识。操作如下图所示:
在这里我们定义了医疗收入由门诊医疗收入和住院医疗收入两部分组成,同时这两个收入下面还包含了更多的子收入。这些三元关系定义完成之后,我们就可以像问一个熟练的业务人员一般轻松地问出“xx医院的医疗收入情况怎么样?”这样的问题了。
不喜欢这种展现方式,也没有关系,你也可以问“xx医院的医疗收入占比“。
你可能会奇怪,明明医疗收入下只定义了两个收入,为什么图表中会多出一个其他来。这就是智问对于知识图谱的优化了,除了传统的定义图谱方式,我们可以一键在医疗收入这个上级属性中定义出需要显示其他收入,这样我们可以直观地看出上级属性和下级属性之间的数据差异,方便排查数据和数据结构。
当然知识图谱并不只是做了这一件事,对于其他方面,包括自然语言理解、辅助计算等也有很多重要的作用,更多信息请保持对我们的关注,我们会在后续的文章中逐步为大家解答。
领取专属 10元无门槛券
私享最新 技术干货