前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >驾驭未来:知识图谱与工业智能问答

驾驭未来:知识图谱与工业智能问答

原创
作者头像
黄成甲
发布2023-11-10 17:00:17
5300
发布2023-11-10 17:00:17
举报
文章被收录于专栏:黄成甲

ChatGPT 是美国人工智能研究实验室 OpenAI 开发的一种全新聊天机器人模型,能够通过学习和理解人类的语言来进行对话,还能根据聊天的上下文进行互动,支持回答问题、承认错误、质疑并拒绝不适当的请求等情境。

中国信息通信研究院联合中国人工智能产业发展联盟对 ChatGPT 进行的测试显示,ChatGPT 在百科检索、数学问答、文学交流、常识问答、知识推理等对话任务上的意图识别率均达到 98% 左右,在生活闲聊上的意图识别率约为 95%,已具备较好的语义理解能力。

但在对稳定性和可靠性要求极高的工业领域,ChatGPT能否代替知识图谱技术,让我来一一给你拆解。

文:黄成甲
文:黄成甲

1.ChatGPT的本质是什么?

要想把ChatGPT的本质讲清楚,就需要把ChatGPT的底层技术,也就是语言模型说明白。什么是语言模型?顾名思义,就是对人类的语言建立数学模型。这里面最重要的关键词是“数学”。语言模型不是逻辑框架,不是生物学的反馈系统,而是由数学公式构建的模型。

因为这是一条捷径。我们想让计算机理解自然语言,让计算机回答问题,或者进行几种语言之间的翻译,第一反应会是,应该让计算机理解人的语言,让它学会语法……但是人们经过很多次尝试,都失败了,或者说至少到今天还没有做到。而换个思路,如果想办法把这些问题变成数学问题,然后通过计算,就能间接解决这些自然语言处理的问题。于是,语言模型的想法就被提出来了。

语言模型是ChatGPT的本质
语言模型是ChatGPT的本质

最初提出语言模型概念的是贾里尼克博士。1972年,他在IBM负责解决语音识别这个课题,也就是让计算机把人说的话识别出来。他采用的方法很特别,不是从语音学和语言学入手研究这个问题。而是采用统计学的方法来解决。怎么说呢?

比如,你传输一句话,“中国是一个古老的国家”。在传输前要对它进行编码,比如编成010101111000…...但是,传输中一定会有噪音和信号损失,接收方接收到的编码可能是1010111000…...这样就翻译不回原来的句子了。 那怎么办呢?我们可以把和接收到的编码相似的句子都列举出来。比如: 国中是一个古老的国家 中国是一个古老的国家 国是一个古老的国家 中国一个古老的国 等等。

计算机如何来确认是哪个句子呢?他的方法是做统计学的计算。 让计算机计算出哪一种可能的语句概率最大。这种计算自然语言每个句子概率的数学模型,就是语言模型。好,到这里你就明白了,ChatGPT的本质是语言模型,就是对人类的语言建立数学模型。

今天,ChatGPT的语言模型所用的训练数据量是很大的,第一个版本使用的GPT-3用了大约5000亿个词,换算成句子大约是500亿个。GPT-4因为模型规模增加了将近一个数量级,训练数据可能增幅更大了。

2.ChatGPT的回答从哪里来?

对事实进行归纳总结
对事实进行归纳总结

我们使用ChatGPT这种语言模型来回答问题的时候,都会发现通常答案都比问题来得长,而且会补上额外的信息,这是如何做到的呢?

在英语中,问题通常都是用一个疑问词开头,而所有的疑问词都由W和H开头,它们也被称为WH单词,包括“是什么”(What),“为什么”(Why),“是谁”(Who),“在什么时候”(When),“在哪里”(Where),“哪一个”(Which),以及“怎么做”(How)。

回答简单问题

对计算机来说,除了“为什么”和“怎么做”的问题属于复杂问题,其他问题都属于简单问题。

比如现在2023年,你问ChatGPT美国总统是谁,它会很快告诉你是拜登。这是有明确答案的。这类问题,计算机根据疑问词和主题词就能理解了,比如这个问题的主题词是“美国总统”,疑问词是“是谁”,再去统计网上关于这个问题的答案,就可以建立一个关于美国总统的语义框架,或者说知识框架。

利用语言模型回答问题,不是一个问题对一个答案这样简单的匹配,而是对于问题给出多个答案,然后根据答案的概率排序,返回一个最可能的答案。比如过去的媒体上还有“美国总统特朗普”“美国总统布什”这样的信息,它们也会被统计进去。但是今天的语言模型都很聪明,它们会给最近的内容赋予较高的权重。最后你得到的答案,就会是当前美国总统的名字。当然,如果正好赶在换届时,数据还没有更新,给出的答案就可能出错。

回答复杂问题

对于这类问题,计算机的做法和人有很大的不同。

人遇到这种问题时,有三种途径能够回答。

第一,你知道答案,直接给出。这种做法,计算机也采用。

比如答案就在某个问答网站内。过去计算机采用网页搜索,把那个网页提供出来。今天ChatGPT则是把相应的一段话抽取出来。

为什么今天和过去采用的做法不同呢?原因有两个。一个是过去计算机对文本进行摘要的能力不够,二是过去的搜索其实很少分析句子的语义,不确定用户的问题和问答网站上的问题是否一致。

比如你问“为什么最近苹果的股票不涨”,网页给你一个三个月前的网页,分析“为什么苹果的股票在涨”,因为这里面主要的关键词都能匹配上。你遇到这种情况会哭笑不得,觉得搜索质量很差。今天ChatGPT足够强大,大部分时候不会犯这样明显的错误。

我们回答复杂问题的第二种情况是,你不知道答案,但是你懂得找到答案的基本知识,于是你利用你的基本知识推出了答案。

比如当有人问你天为什么是蓝色的,你学了中学物理,知道太阳光是由七色光构成的,不同颜色的光折射率不同。同时你还能活学活用,想到阳光进入大气层时因为折射率不同会发生散射,导致天空显得是蓝色的。

但是,计算机其实没有这个能力。硅谷的几家著名公司,对ChatGPT进行了全面的测试,发现它回答小学常识课(美国叫自然课)的问题,正确率还不到60%。为什么呢?因为这部分问题很少在网络上被讨论,或者网络上没有靠谱的答案,而ChatGPT没有办法像人那样运用知识去寻找答案,只能从现成的答案里归纳总结。

人类解决复杂问题的第三种情况是,你不知道答案,而现有的知识也无法直接推导出答案,需要你做研究工作。

比如这几年疫情,市面上能找到几十种口罩,有些管用,有些不管用,有些虽然管用但是效果有限,到底哪种才靠谱?虽然你能够在互联网上找到一些这方面的内容,其实一大半都是过时的,甚至是想当然的、错误的。过去从来没有人对所有的口罩进行对比研究。这个看似并不复杂的问题,其实并没有好的答案。

2020年,斯坦福大学材料学专家崔屹教授的团队进行了全面的研究,彻底回答了这个问题。比如他们发现,真正能够有效过滤新冠病毒的口罩,是靠口罩纤维上的静电力把病毒吸附在口罩上,让它无法进入口鼻,而不是用纤维网把病毒挡住。他们还发现,纤维越细的口罩,防护效果越好,纤维粗的反而防护效果差,这和人们的直观感觉有很大的差异。后来诺贝尔奖得主朱棣文教授给了一个合理的解释,就是静电场和纤维直径的平方成反比,纤维粗的口罩的吸附能力弱。这项研究还有很多发现,比如口罩一旦沾染了潮气,防护力基本上就丧失了。基于这项研究的综述论文发表之后,得到了广泛引用。

你看,对于这样的问题,人类是需要通过实验和探索发现新知,而且更正过去认识错误的。这显然也是ChatGPT做不到的。

ChatGPT如何工作

那么ChatGPT的答案从哪里来呢?简而言之,回答问题也好、写作短文也好,都基于它对现有事实的抽取和整合,或者说归纳总结。

说到这里,我就要开始讲知识图谱了。Google曾经收购了一家专门构建知识图谱的小公司,那家小公司完成了对上百万个知识点的总结,并且构建出它们之间的相互关系。在对上万亿语句进行分析后,这个知识图谱得到了很大的补充。后来,负责Google知识图谱的副总裁到了苹果,是今天苹果Siri的负责人。苹果的Siri其实背后也有一个知识图谱。ChatGPT背后也一样,虽然它没有公布如何利用各种知识,但是它下载了整个维基百科,而维基百科有一个现成的知识图谱。

当人们在问答系统中提一个问题后,问答系统会首先在知识图谱中寻找可能答案。对于我们前面讲到的简单问题,只要问题靠谱,答案通常都能直接找到。

但是对于复杂问题,有些可以通过知识图谱中的几个相关联的知识点回答,但大部分就不行了,于是需要回到提供知识的原始网页中去寻找答案。这个过程其实是一个逆向思维的过程,和人的思维方式不太一样。

比如我现在问一个复杂问题,计算机就会去找到几十上百个可能包含答案的文章,然后从这些文章中提取一些语句,构成可能的答案。当然,为了让这些句子凑在一起看上去像是一个有逻辑的、连贯的回答,就需要使用语言模型了。

换句话说,这些候选的文章里有了原材料,而语言模型是一个厨师,将它做成一道菜。如果语言模型质量不高,提供的答案就是几个事实的堆砌,让人看了觉得毫无连贯性可言。ChatGPT之所以比之前的问答系统做得好,并不是它的原材料更多,而是菜做得更精致。

3.什么是知识图谱?

知识图谱(KG)
知识图谱(KG)

知识图谱就是描述真实世界存在的实体,并且和这些实体之间的一些关系,它与互联网不同的点在于,我们都知道互联网是网页跟网页之间的相互连接,实际上是通过字符串连接的。但是在知识图谱,实体是通过语义关系来进行关联的,这些实体都是具有现实的物理存在的一些意义的。

知识图谱的定义
知识图谱的定义

比如说以工业场景为例,我们可以把公司的这些人物、设备,或者是具体的一家公司,公司的各种产品,把它看做实体。这些实体之间天然的关系,比如说公司跟人员之间有这种雇佣的关系,公司跟地理位置之间有这种位移的关系,以及和产品的使用关系和生产关系等等,我们可以通过实体和它的语义关系形成一张知识图谱。可以说知识图谱,如果我们从学术角度来看的话,它就是一种语义网络,是大数据和AI时代知识表示的重要方式之一。 然后从这个技术角度来说的话,知识图谱是一个技术,是一门技术体系,它是大数据与AI时代知识工程的一个代表性的进展。

4.知识图谱与智能问答

知识图谱与智能问答
知识图谱与智能问答

知识图谱与智能问答其实是两个相关的概念,它们都在人工智能领域中扮演着重要的角色。

知识图谱是以图形结构表示的知识库,它包含了实体、属性和实体之间的关系。通过对大量的数据进行加工、处理和整合,知识图谱能够将复杂的信息转化为简单、清晰的三元组形式,从而实现知识的快速响应和推理。知识图谱的构建需要从实体维度和短句维度进行挖掘,通过获取大量数据并进行挖掘、标注和清洗,定义实体之间的关系。

智能问答系统是一种能够接受用户自然语言形式提问并给出准确答案的系统。它通过对问题进行语义分析、知识检索和答案生成等步骤来实现。在智能问答系统的整体基础框架中,包括预处理模块、问句分析、知识检索和答案生成等部分。基于知识图谱的智能问答系统(KBQA)是一种常见的技术路线,它利用知识图谱中的数据进行问题的解析和查询,从而得到准确的答案。

知识图谱与智能问答系统的结合可以提高问答系统的准确性和效率。通过利用知识图谱中的丰富知识和关系,智能问答系统能够更好地理解用户的问题,并给出更准确的答案。同时,知识图谱也可以为智能问答系统提供更多的背景知识和上下文信息,从而提升系统的智能化水平。

5.在工业智能问答领域,大语言模型ChatGPT能否替代知识图谱技术?

ChatGPT替代知识图谱
ChatGPT替代知识图谱

这也是近期在知识图谱技术领域,引发讨论最多的一个问题。由于ChatGPT在语言理解和知识问答方面的优异表现,大语言模型被认为具备记忆和应用世界知识(world knowledge)的能力,这就使得有一些观点认为另外一种世界知识的表示和推理模型知识图谱(Knowledge Graph)将要被以ChatGPT为代表的大语言模型所取代。有没有这种可能,我们先说应用趋势,再说应用挑战。

应用趋势

ChatGPT作为一种基于深度学习技术的大语言模型,具有强大的自然语言处理和生成能力。它可以快速处理和生成文本,对于自然语言处理方面表现出色。许多企业也开始尝试将ChatGPT引入工业制造领域,例如西门子与微软合作,将ChatGPT运用在工业领域,借助 ChatGPT 以及其它 Azure AI 服务来增强西门子的工业自动化工程解决方案,包括工程设计团队如何使用自然语言输入生成 PLC 代码,从而减少时间成本并降低错误率。国内的汽车厂商长安汽车也宣布,旗下车型长安逸达将作为国内首款搭载“文心一言”的量产车型。“文心一言”集成了车辆的使用和维护知识,将车辆故障和维保知识建立图谱,变成专有的“车辆数字助手”。

逸+一>2
逸+一>2

另外,专注于智能文本处理技术的公司“达观数据”,旗下的产品—达观智能知识管理系统(KWS),也融合了大语言模型与智能制造的先进技术,为工业制造领域提供集中、高效、智能的知识管理平台。其产品的自动化知识生产、组织和搜索功能,结合深度的系统整合能力,帮助工业制造企业在生产计划、质量管理、设备维护和供应链管理等关键业务场景中发挥重要价值。

大语言模型与知识图谱结合应用
大语言模型与知识图谱结合应用
应用挑战

说完了,大模型在工业领域的应用趋势与案例,我们再来说说应用挑战。尽管ChatGPT在回答问题方面表现出色,亦有行业案例落地。但在工业知识问答中仍存在以下挑战:

(1)数据量和质量

工业领域的知识通常庞大而复杂,需要大量高质量的数据来训练大模型。然而,获取和整理这些数据可能是一项艰巨的任务,因为它们可能分散在各种来源和格式中。拿电力行业的数据举例:输电线路的数据既存在非结构化数据(历年故障文档)、又有半结构化数据(线下存储的Excel格式的文档或者规范化的文本数据)、结构化数据(设备台账数据)。

(2)领域专业性

工业领域的知识通常需要特定的专业知识和背景才能理解和回答。大模型可能无法涵盖所有领域的专业知识,因此在回答特定领域的问题时存在局限性。

以制造工艺为例,虽然知识的通常来源有领域论文和书籍,企业或组织机构积累的工艺设计手册、工程规范标准、专家经验知识等,看起来很类似。但事实上,新能源电池的制造工艺、炼油厂的炼油工艺和晶圆厂的半导体制造工艺大相径庭。炼油厂的工程师可能无法理解制胶、匀浆、涂布、卷绕、烘烤、注液、喷码、X射线检测等锂电池制造工艺及其内涵。反之,锂电池企业的工程师则可能无法理解什么是常压蒸馏、减压蒸馏、催化、裂化、焦化、催化重整、提升管、沉降器、胺液回收器、再生器、吸收塔、稳定塔、抽提塔、缓冲塔、砂滤塔、空压机、凝缩油罐、脱硫吸附罐、水洗罐、预碱洗罐、固定床、沸腾床、悬浮床等炼油工艺。

而不管是炼油厂的工程师,还是锂电池企业的工程师,可能都不懂硅料提纯、晶体生长、整型、切片、抛光、化学机械研磨、化学气相沉积、介质沉积、蚀刻、离子注入、表面钝化、掺杂阻挡层、曝光、显影、薄膜沉积、烘烤、干涉位移测量、物理气相沉积等半导体制造工艺。特别的,锂离子电池制造和晶圆制造都有“烘烤”工艺,而其表达的知识却有着天壤之别,工艺内容、方法、使用的设备等都完全不同。这些专业的知识及从业务出发所构建的各种专业模型,大模型很难完全涵盖,尤其芯片制造、化工等工业领域涉及到上下游产品、原料供应链的知识往往是跨学科的。

(3)知识更新和变化

大语言模型在知识更新方面的能力一直被诟病,比如说ChatGPT刚刚出来的时候,只能回答2021年之前的知识类问题,因为ChatGPT没有采用2021年之后的数据进行训练,

工业领域的知识通常会随着时间的推移而发展和变化。大模型可能无法及时跟踪最新的知识更新,导致回答过时或不准确的问题。

举一个例子,假设有一个工业知识问答系统,用户询问关于某种新型材料的性能和应用。由于该材料是最近才被开发出来的,相关的研究和应用可能还没有被广泛报道或整理成为结构化的知识。在这种情况下,传统的搜索结果可能无法提供准确和详尽的答案。

而要使用新的数据训练成本非常高。跟知识图谱采取图操作相比,对大语言模型进行更新需要耗费大量的服务器资源,如果是频繁更新,大语言模型付出的代价会远远超过知识图谱。举个例子,战胜李世石的那一版AlphaGo,消耗的能量是一栋十几层办公大楼的耗电量。而参数量1750亿,预训练数据量45TB的GPT-3,据Semianalysis估算,ChatGPT一次性训练费用就达8.4亿美元。

(4)解释性和可信度

大模型生成的答案通常是基于统计模式和训练数据的,可能缺乏解释性和可信度。在工业领域,解释性和可信度对于决策和问题解决非常重要。

举个例子,假设有一个工业知识问答系统,用户询问:“为什么某个产品的生产成本上升了?”如果使用大模型回答,可能会得到一个简单的答案,如“可能是原材料价格上涨导致的”。然而,这个答案缺乏解释性和可信度,无法提供更深入的理解。

而一个基于知识图谱的工业知识问答系统可能会提供更具解释性和可信度的答案。它可以通过查询知识图谱中的相关信息,解释生产成本上升的原因,如原材料价格上涨、劳动力成本增加、能源价格上涨等。同时,知识图谱可以提供支持答案的具体数据和来源,增加答案的可信度。

总结来说,大模型在工业知识问答领域的挑战在于问题的复杂性、知识更新速度、以及工业领域要求可解释性和可信度。

6.知识图谱与大模型双知识平台的融合

既然知识图谱和大型语言模型都是用来表示和处理知识的手段。大模型补足了理解语言的能力,知识图谱则丰富了表示知识的方式,两者的深度结合必将为人工智能提供更为全面、可靠、可控的知识处理方法。

东南大学漆桂林:知识图谱和大语言模型的共存之道这篇文章中,东南大学漆桂林教授、南京柯基数据科技有限公司杨成彪(CTO)和吴刚(CEO)为我们分享了“知识图谱和大语言模型的共存之道”。文中列举了知识图谱和大语言模型作为知识库的优缺点,提出知识图谱和大语言模型双知识平台融合的理念,以及如何应用双平台协同完成复杂知识处理任务。

知识图谱和大模型双知识服务平台
知识图谱和大模型双知识服务平台

上图是知识图谱和大语言模型融合的双知识服务平台架构。从这个架构中我们可以清晰地看出大语言模型跟知识图谱的核心技术具有惊人的相似性:大语言模型的预训练跟知识图谱的知识建模相似,都需要人工整理和理解数据,但是也可以通过某种自动化方式提升效率;监督微调跟知识抽取对应,都是用于从数据中提取知识,只不过大语言模型利用微调提取的知识存储与神经网络;大语言模型跟知识图谱一样需要做知识更新和融合,大语言模型的推理对应于知识图谱的知识计算。另外,大模型和知识图谱都需要考虑知识管理,而且都需要考虑知识众包、知识质量评估、知识链接等。

从上图还可以看出,知识图谱构建成本可以通过大语言模型得到极大的降低,大语言模型可以提升知识自动建模的效率,可以为知识抽取生成标注数据,利用大语言模型的知识理解能力,可以设计通用信息抽取方法,利用一个模型抽取实体、关系、属性值、事件,大语言模型还可以做零样本知识生成,利用通用信息抽取得到的三元组,通过人工校对形成大标注数据还可以用于训练监督模型,大语言模型可以有助于提升知识融合的自动化,并且大模型可以有助于知识图谱的知识表示学习。另外,知识图谱可以为大语言模型提供语料生成,Prompt增强和推理增强。

总结:大语言模型作为一个知识库。它的知识质量可能存在一定的问题。它的问答精确度可能也不够高。还存在不可解释性的问题。为了解决这些问题,将知识图谱和大语言模型结合起来是一个很好的方向。知识图谱作为一种符号化的知识表示方式,可以提供结构化的、可解释的知识。通过将知识图谱和大语言模型融合,可以充分发挥两者的优势,拥有无限的想象空间。这将使人工智能进入真正的大知识时代。

7.多谈一点:行业知识图谱应用价值及关键点

对于工业制造领域的企业或其内部某个团队来说,知识图谱是一个新鲜事物,对其不甚了解,因此对是否引入知识图谱技术存有疑虑,笔者在与传统制造业的生产部门及信息化部门的同行交流过程中,发现他们最关心的是投入产出比,也就是如何衡量其价值。在这篇文章的最后,我也想多谈一点:行业知识图谱的应用价值及关键点。 

1. 工程师赋能,提升效率

知识图谱行业应用的最直接的价值是为知识型的劳动者和工程师赋能,提高工作效率。通常体现在以下两个方面。

(1)替代

即代替部分劳动者和工程师做一些较为复杂的、专业的、知识型的工作。替代所带来的价值体现为以下三个方面。

·工作量的减少带来直接收益,这部分被解放出来的高端人力可以完成其他更具创造性的工作,比如创新型的探索、系统性的方案设计、根本性原因机理的深究,等等。 ·通常来说,重复相同的或相似的工作的时间会缩短,从而带来产品竞争力或服务美誉度的提升,并因此为企业或组织机构带来收益。 ·质量、准确率等的提升,以及由此带来的产品或服务溢价。

比如,某财务审计公司基于会计准则和财务审核规则构建审计知识图谱,并依据公司过去若干年积累的审计经验开发了专门自动审核模型,经过较为严格的测试后,能够保证审核通过的部分是满足监管要求的。这样,审计知识图谱的应用能为该公司带来以下好处。

·节省专业的审计工作量,审计人员专注于解决没有通过自动审计的部分内容,从而提升审计质量。 ·缩短审计周期,提升了响应效率,为该公司带来了大量的新客户。 ·因审计质量和响应效率的提升,从而能够服务更多要求更高的客户,因此带来项目价格的提升。

(2)辅助

即借助可视化和交互式分析技术实现人机的高效协同。也就是说,在行业知识图谱的帮助下,工程师或知识型劳动者能够更为便捷地获取知识,降低工作门槛,提升工作的质量和效率,并因此给企业带来价值,主要体现在以下三个方面。

·很多知识型工作要求工程师或劳动者具备丰富的经验,但这并不容易,不仅要求企业或组织机构付出更高的成本,在某些情况下甚至很难招聘到合适的人才,通过应用行业知识图谱能够有效降低门槛,并由此带来价值。 ·在实际工作中,即便非常资深的专家也常常遇到力有不逮的情况,应用行业知识图谱能够帮助这些资深专家完善知识体系,减少遇到力有不逮的情形,并由此带来相应的价值。 ·基于行业知识图谱开发专业的辅助工具,并借此来规范所提供的服务,提升工作质量,从而带来更高的用户友好性,由此带来价值。

在企业中,利用知识图谱辅助工程师、客服人员或员工是常见的做法。比如银行的客服中心,基于业务知识图谱开发客服辅助工具,能够大幅提升客服人员对业务的熟悉程度,提升客服解决问题的效率,并由此带给企业以下两个方面的价值。

·效率提升带来的接通率提高或者人员减少所对应的价值。 ·客户好感度上升带来的黏性和美誉度所对应的价值。

在实践中,通过行业知识图谱为企业员工、组织机构的成员或其上游供应商、下游客户进行赋能,提升效率,提高产品和服务质量,并因此贡献更大的价值。

2. 管理决策支持,控制风险

现代企业、组织机构的运营和管理往往面临着复杂的环境,数据、信息和知识异常丰富,每一个决策都涉及非常多的要素,容易陷入信息过载的情形而导致不得要领,或者被困入信息茧房却不自知而导致决策偏差等。行业知识图谱具备汇聚、关联和融合企业内外部的各类信息和知识的作用,结合企业、组织机构的特色经验进行统计分析和深度建模,避免信息过载,提供全局决策知识支撑,冲破信息茧房,从而辅助管理者更全面、更深度地思考所面临的问题,做出有效的决策。

(1)全局洞察

通过行业知识图谱汇聚所有相关信息并进行关联融合,打破信息孤岛,做到全局的统计分析,避免管理者做决策时只见树木、不见森林,相应的价值体现在以下方面。

·战略价值,通过对全局信息的掌控,避免对企业、组织机构的战略决策失误,从而带来价值。 ·持续优化的价值,通过全局分析和关联协同,找到企业、组织机构运营管理中的关键问题并进行持续优化,从而带来价值。 ·避免一叶障目、不见泰山,以致于陷入局部优化但全局变差的情形,由此所产生的价值。

这种全局洞察的例子无处不在,比如在新冠疫情中,中国的防疫政策就是从全局决策出发,阻断疫情扩散,实现动态清零,并由实践检验其决策的正确性;相反,许多国家因没有及时阻断疫情传播,导致疫情扩散,致使经济、社会发展、生活和生命健康等方方面面都受到严重影响。

(2)深度剖析

知识图谱善于挖掘不同知识之间的关联,知识推理有关的很多前沿研究都集中在如何挖掘潜在的关联关系。企业的许多决策都需要穿透多层关系,才能够发现真正的问题,并因此做出正确的决策,否则容易发生南辕北辙的情况——出发点是好的,决策看起来也没问题,但结果却不好。管理者在做决策时,不仅要考虑周全,还要深入思考,将行业知识图谱与经验相结合,将一系列的逻辑转化为专业的辅助决策模型,将隐藏的关联知识加以显式化,致使错综复杂的关系变得清晰,减少隐藏在企业、组织机构“阴暗处”的问题,避免管理者做出看似合理实则大有问题的决策。因此,行业知识图谱的价值就体现在能够深入挖掘潜在的、没被人注意的点。

在实践中,决策支持方面的价值相对比较“虚”,难以被量化,但这类应用往往能够激发管理者思考的广度和深度,甚至引发其对管理架构的思考与调整。正如很难对人的生命进行金钱量化,行业知识图谱赋能管理决策的价值也一样,这是因为管理决策的百密一疏就可能导致企业和组织机构的毁灭。应用行业知识图谱,很有可能在某些点上对管理者加以提示,使其考虑得更为周全和深远一些,因此避免重大失误,实现持久的竞争力,并由此带来巨大的价值。

3. 知识的沉淀,避免流失

如今,企业家和组织机构的管理者都已经深刻体会到知识的重要性,并付出巨大努力,试图充分利用知识来保持竞争优势,并因此获得超额的收益。行业知识图谱的应用在客观上实现了知识的即时沉淀和持续传承,为行业领先者保持优势和追赶者加速崛起赋能。

(1)即时沉淀

利用行业知识图谱随时随地沉淀知识,并且所沉淀的知识立即就能够为相关人员所使用,由此带来相应的价值。即通过综合手段促进知识的即时沉淀,实现知识的新陈代谢,避免知识的老化,具体表现为以下两个方面。

·通过对接等自动化手段,及时从各种数据源汇集数据和信息,并通过知识图谱构建技术更新到行业知识图谱中,实时为各个应用方所使用。

·以行业知识图谱的应用为契机,建设和完善规范化知识沉淀的管理规约并构建相应的模型,由此推进企业员工或组织机构成员自动提交、共享并沉淀知识。

(2)避免遗失

通过行业知识图谱的即时沉淀,避免知识在企业、组织机构中遗失,并由此为企业带来巨大的价值。通常,企业知识的遗失可以划分为三大类。

·死知识,即知识虽然以某种方式沉淀下来了,但几乎无人问津,比如有些知识存储在某个共享目录上、保存于档案室中的某个文件中,理论上很多人都能访问到,但实际上却因种种原因几乎无人使用。 ·流失的知识,即知识或经验在某个专家那里,并没有总结并沉淀下来,当该专家退休或离职后,知识彻底流失。 ·未知的知识,即知识已经存在并公开(比如发表在论文中的知识),但企业的员工或组织机构的成员并未了解这些知识。

行业知识图谱能够汇聚企业或组织机构内外部的各种相关知识,具备完整和精确的记忆能力(相对来说,人的记忆则是模糊的),结合合理的管理规约开发出沉淀知识的应用程序,从而记录企业或组织机构的各种专家知识。“人生到处知何似,应似飞鸿踏雪泥”,企业和组织机构也应当如此,采用行业知识图谱沉淀专家经验,积累行业知识,聚集和拼装日常工作中所承载的不可胜数的知识与经验,形成宝贵的财富。否则,就像“泥上偶然留指爪,鸿飞那复计东西”,雪泥鸿爪虽有痕迹却易消散,知识与经验即使宝贵也未必能产生价值。

有一个拧螺丝的故事:某个工厂的机器坏了,工厂修不好该机器,于是找专家来解决问题。该专家到现场后,拧了机器上的一个螺丝就修好了,收费1万元(不同版本金额差别很大,不予深究)。厂长认为,这么简单的事情不值1万元。专家却回答说,拧螺丝只值1元,而知道拧哪个螺丝值9999元。这个故事原本的目的是体现知识的价值。反过来,这是典型的故障归因分析和维修场景。如果机器厂商特别依赖于某个专家,并且只有该专家知道“know how”知识,这其实很危险,一旦该专家因某种原因离开了机器厂商,这个知识就遗失了,未来要解决这样的问题也许要付出高昂成本,也许无法解决,并因此损害了机器厂商的声誉,降低了竞争力。如果利用行业知识图谱将专家的经验沉淀下来,并以专业诊断模型提供服务,则不仅没有知识遗失的风险,并因维护成本较低、服务好,进而提升机器厂商的声誉和竞争力,扩大市场份额,获得巨大的收益。

4. 集体智慧协同,组织进化

行业知识图谱带来的不仅是个体的知识沉淀,更最关键的是为企业、组织机构带来了集体智慧。“三人行,必有我师”,在现实世界中,并没有哪个人拥有绝对的知识;“尺有所短,寸有所长”,在企业或组织机构中,每个人既有其擅长之处,又有其知识盲区。行业知识图谱的最大收益在于避免个体专家的认知局限,为每个人提供集体智慧的佐助,从而大幅缩减盲区的范围,提升工作效率。集体智慧也能够减少企业员工或组织机构成员“重复造轮子”,更容易站在“由集体智慧构成的巨人肩膀上”进行创新。

(1)集体智慧

行业知识图谱凝聚了行业丰富的知识及企业、组织机构专家的经验,从而摆脱对个体专家的依赖,避免了个体专家的认知局限,实现了集体智慧。具体来说,有以下方面的表现。

·行业知识图谱的知识来源丰富,既可以包含领域内不同专家的知识和观点,也包含企业或组织机构对这些知识的实践检验结果。 ·同一个知识点的可能有多个不同的来源,行业知识图谱会“忠实”记录每个来源,同时能够溯源。 ·将知识推理技术与行业实践经验相结合,能够对知识进行相互碰撞和校验,挖掘异同,包括对同一知识点的不同来源的校验,以及对不同知识点进行推理校验等。 ·以矛盾的对立统一视角看待知识融合,对互相印证相一致的知识予以强化,对矛盾所在之处予以如实记录。在应用中,遇到矛盾所在的知识时加以提示,并在矛盾解决时予以确认。

(2)巨人肩膀

企业、组织机构不同的人都可以对这些由集体智慧凝结成的行业知识加以利用,就像牛顿所说的“站在巨人的肩膀上”。对于牛顿来说,这巨人并非具体的、实在的某一个人,而是在牛顿之前的所有科学成就所组成的“巨人”。同样的,每一个企业员工或组织机构成员的业务应用和创新也站在由集体智慧所凝结的行业知识图谱这个巨人的肩膀上。行业知识图谱也因此为企业或组织机构带来了极其宝贵的价值。通常来说,包括以下方面。

·自始至终的可持续学习,这是由于知识源源不断地输入行业知识图谱中,“巨人”得以持续成长。 ·减少重复造轮子,当人们能够方便地从行业知识图谱中获知最新的知识和经验并在业务中应用时,自然就减少甚至避免了重复的工作。 ·创新的加速、前沿知识和最新的最佳实践,经由行业知识图谱源源不断地输入企业员工或组织机构成员的大脑中,大幅减少重复造轮子的情形,减少精力和智力的双重负担,致使更多创新得以被激发。 ·日积月累带来的复利效应,在数学上,指数级增长是极其可怕的,如果“巨人肩膀”能够在每天为每个人提升千分之一的效率,一年250个工作日就能为每一个员工提升至少28%(1.001250=1.2839)的效率,而对于具有成千上万名成员的组织来说,其效益更是不得了。

(3)组织进化

集体智慧和巨人肩膀为组织打开了全新的视野,加速组织在运营模式、管理理念和文化精髓三个层次上的变革。当知识图谱融入组织认知基因后,就开始了一个没有终点的进化过程,就像人类自从发生了认知革命之后即开始了持续的进化。同样的,就像认知革命之后的人类主宰了整个地球,而基于群体智慧的认知图谱也将驱动着组织永无止境地创新,最终主宰整个行业。笼统地说,主要体现在以下方面。

·运营模式认知化,知识的创新、沉淀、传承、应用如同新陈代谢一样自然。 ·管理理念认知化,全局洞察、深度剖析、集体决策、知识驱动成为顺理成章的事。 ·组织的认知变革成为文化的精髓,知识图谱成为组织不断成长的阶梯。

在实践中,实现集体智慧的协同很难,组织进化更难,但集体智慧带来了1+1>2的价值,指数级的成长则是持续保持竞争优势的不二法宝。通过深度应用行业知识图谱,扩展企业和组织机构的认知边界,有利于形成独特的创新性产品和服务,并因此获得持久且巨大的收益。在智能化呼声此起彼伏的今天,服务创新、模式创新、质量创新、管理创新无一不依赖于行业知识图谱的深度应用。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 1.ChatGPT的本质是什么?
  • 2.ChatGPT的回答从哪里来?
  • 3.什么是知识图谱?
  • 4.知识图谱与智能问答
  • 5.在工业智能问答领域,大语言模型ChatGPT能否替代知识图谱技术?
  • 6.知识图谱与大模型双知识平台的融合
  • 7.多谈一点:行业知识图谱应用价值及关键点
相关产品与服务
灰盒安全测试
腾讯知识图谱(Tencent Knowledge Graph,TKG)是一个集成图数据库、图计算引擎和图可视化分析的一站式平台。支持抽取和融合异构数据,支持千亿级节点关系的存储和计算,支持规则匹配、机器学习、图嵌入等图数据挖掘算法,拥有丰富的图数据渲染和展现的可视化方案。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档