众所周知,人工智能(Artificial Intelligence,AI)的研究大致有三个派别:符号主义、联结主义和行为主义。
简单来说,符号主义主要是用公理和逻辑体系搭建一套人工智能系统。联结主义主张模仿人类的神经元联结机制来实现人工智能。行为主义认为,智能取决于感知和行动,环境的反馈有助于智能的提升。
不同的研究视角派生出不同的学术流派。
然而,这些看似泾渭分明的主义,如果站在更高的抽象视角来审视,它们其实具有共同的特征——都是在研究事物间的关系(Relation)。
自2012年之后,以深度学习为代表的联结主义可谓风生水起,在计算机视觉、自然语言处理等领域均有广泛应用。如前所述,深度学习在很多领域取得的效果固然很好,但因为它属于典型的“端到端”黑盒模型,因此存在阿喀琉斯之踵(Achilles's Heel)——无法对预测的结果给出合理的解释。在探寻真理的路上,人们是不被允许在“知其然,不知其所以然”的非理性繁荣中徜徉太久的。要知道,追求因果,可能是人类保持心神安定的重要慰藉。
“天下无不散之筵席”,目前深度学习的技术红利收割已趋饱和,盛宴已过,诸神黄昏,需要纳入新的理论来突破AI的天花板。很多奋斗在科研第一线的科研人员很敏锐地意识到了这一点。2019年11月,在著名学术会议NeurIPS(Conference on Neural Information Processing Systems,神经信息处理系统大会)的主旨演讲上,图灵奖得主约书亚·本吉奥(Yoshua Bengio)借鉴著名心理学家卡尼曼提出的“系统1”(快速、直觉、无意识)和“系统2”(慢速、逻辑、有意识)的理念,指出深度学习的未来应走向“系统2”,如下图所示。
以深度学习为代表的人工智能已在“听、说、看”等感知智能领域达到或超越了人类水准,但在需要外部知识、逻辑推理或领域迁移的认知智能领域还处于初级阶段。也就是说,深度学习的研究应从以感知智能为主,逐步向基于认知的逻辑推理方向演进。
显然,逻辑推理明显属于符号主义的研究范畴。被“慢待已久”的符号主义,似乎正酝酿着“冬天到了,春天还会远吗”的情绪表达。但怎样表达逻辑推理呢?除了传统的符号,图(Graph)也是一个颇有潜力的表达方式。
无独有偶,2020年,清华大学张钹院士在《中国科学》第9期撰文提议:我们应“迈向第三代人工智能”。他认为,第三代人工智能发展的思路是:把第一代的知识驱动(符号智能)和第二代的数据驱动(感知智能)结合起来,通过协同利用知识、数据、算法和算力四要素,构造更强大的第三代AI(知识智能)。
清华大学唐杰教授在《人工智能下一个十年》主题报告中给出了一个实现认知智能的探索路径:认知图谱=知识图谱+认知推理+逻辑表达。显然,图谱需要用图来表达。
英雄所见略同,2020年9月,在中国郑州召开的“第十六届全国高性能计算学术年会”上,陈左宁院士做了题为《人工智能进展对算力需求分析》的主题报告。在该报告中,陈左宁院士也认为,人工智能三大流派日趋融合,协同发展。她总结道:“人工智能的核心特征就是对‘关系’的研究。”“关系”的表现形式有三种:一是联结关系,比如,神经网络中神经元间的联结、反向传播算法中的梯度传播和进化算法中的变异;二是逻辑关系,如RNN(循环神经网络)中的循环连接及知识图谱中的推理关系;三是因果关系,如贝叶斯、决策树及强化学习中的控制连接。
我们常说“有人的世界,就有江湖”。与此类似,有“关系”的地方,就有图。万物之间皆有联系。如果说人工智能的核心特征之一就是“关系”,那么描述“关系”的首选工具会是谁呢?当然就是图!图作为一种通用的数据结构,可以很好地描述实体与实体之间的关系。
虽然深度学习的技术红利有“日薄西山”之势,但并不会“戛然而止”。按照科技哲学家凯文·凯利(Kevin Kelly)的观点来看,技术是另外一种生命,它拥有自己的“技因”(Teme),为保持生命力,它会不断演化,从而达到技术自身的适者生存。深度学习作为一项AI前沿技术,亦会如此。
神经网络技术与图理论结合就塑造出了——图神经网络(Graph Neural Networks,GNN),这是技术发展趋势的理性宣泄。我们可以认为,GNN是图在深度学习领域的生根发芽,也可以理解为,GNN是深度学习在图数据领域的开疆拓土。如此这般,便能大致勾勒出图神经网络的模样。
图神经网络时代来临
“图”数据是图神经网络处理的对象,在中文语境中,“图”和“图像”感觉类似,实则不然,下面我们先来梳理这两者的区别。
01
图与图像大不同
(a)由像素构成的图像 (b)由节点和边构成的图
图作为一种高效描述实体间关系的数据结构,在数据分析中扮演着越来越重要的角色。很多涉及关系的计算问题,都可以转化为一个面向图的计算问题。比如,在社交网络分析、推荐网络分析、疾病传播探究、基因表达网络分析、细胞相似性分析等领域,图都有着广泛应用。
举例来说,分子式就可以视作一张图。分子中所有的粒子都在相互作用,但当一对原子彼此之间保持稳定的距离时,我们说它们共享一个共价键。不同的原子和化学键(Chemical Bond)有不同的距离。分子内的3D拓扑结构便可以用图描述,其中节点为原子,边为共价键。分子的3D表示和分子的图表示如下图所示。
分子的3D表示 分子的图表示
再例如,社交网络(Social Networks)关系也可以表示为一张图。社交网络是研究人类、机构和组织的集体行为模式的工具。我们可以通过将个体建模为节点,将他们的关系建模为边,来构建一个表示人群的图。
随着移动互联网、物联网及社交网络等技术的发展,众多新兴应用正以前所未有的方式和速度产生并积累着大量图数据(见下图),如何对这些数据进行分析并使用,已成为许多领域面临的机遇与挑战。
02
图神经网络的本质
。通常,我们把输入变量(特征)空间记作大写的
,而把输出变量空间记为大写的
。于是,机器学习在形式上就近似于寻找一个好用的函数:
再具体到图神经网络学习,其本质也脱离不了上述范畴。在本质上,它完成的任务也是构建一个函数映射,针对特定的图数据X,经过数据预处理、数据转换,然后按照某种学习得到的规则,给出一个输出Y(如分类信息或回归值)。图神经网络的本质如下图所示。问题在于,如何找到这样的映射关系?于是,各类图神经网络算法应运而生,八仙过海,各显神通。
图神经网络是一种将图数据处理和深度学习网络相互结合的技术。它先借助图来表达“错综复杂”的关系,当节点以某种方式局部聚合其他节点信息后,再做数据的“深加工”,可将其用于分类、回归或聚类等任务中。
图的确有着广泛的应用场景,但相比传统的栅格数据,图的表示更加复杂,对它的处理难度也更高,因此,图神经网络在应用当中也面临着一些困难与挑战。
但我们无须惧怕这些困难与挑战,尤其AIGC时代已来,我们更应该敢于拥抱AI技术。ChatGPT作为一种强大的自然语言生成模型,本质上是一种高阶的深度学习模型,ChatGPT可以与图神经网络的概念和技术相结合,进一步拓展其应用领域。这种结合有助于提升ChatGPT在知识图谱、智能问答和对话系统等领域的性能,为用户提供更智能、个性化的交互体验。
欢迎阅读《从深度学习到图神经网络:模型与实践》一书了解更多相关内容。
本文分享自 博文视点Broadview 微信公众号,前往查看
如有侵权,请联系 cloudcommunity@tencent.com 删除。
本文参与 腾讯云自媒体同步曝光计划 ,欢迎热爱写作的你一起参与!