前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >新概率书 Structured Probabilistic Reasoning

新概率书 Structured Probabilistic Reasoning

作者头像
CreateAMind
发布2022-03-14 14:28:13
4990
发布2022-03-14 14:28:13
举报
文章被收录于专栏:CreateAMind

关键词:图形推理,量子理论,从正确或错误中学习,反向推理,精确的数学区分,推理涟漪效应,可解释的坚实数学基础,因果

how we learn 第二章 人脑比机器强在哪?(长文)提到贝叶斯在认知及学习中的重要作用毋庸置疑,贝叶斯概率理论方法也需要继续发展,这本未完成的新书为贝叶斯理论方法的发展做了很多工作:

序言相关介绍的自动翻译:

在概率领域有相当多的数学结构。这本书存在的理由是比通常强调的有更多的结构——尤其是代数的和范畴的。

这本书受到量子理论的影响,例如,在书写离散概率分布时,使用“状态”、“可观测的”和“测试”作为“分布”、样本空间上的 R 值函数和相容(可求和)谓词的同义词;在书写离散概率分布时,使用 ket 符号|–); 在使用 daggers 作为反转时,类似于共轭转置(希尔伯特空间)。

应该说:对于受过正规方法训练的人来说,概率理论的领域可能是相当草率的:一切都被称为“P ”,类型很少被使用,关键成分(如期望值的分布)被隐含,基本概念(如共轭先验)仅通过例子介绍,计算公式和算法通常只是给出,没有解释、目标或理由等。这很伤人,尤其是因为周围有这么多美丽的数学结构。例如,通道的概念(见下文)将条件概率的概念正式化,并带有丰富的数学结构,可用于组合推理,包括顺序组合和并行组合。通道的贝叶斯反演(“匕首”)不仅具有吸引人的数学(分类)属性,例如与顺序和并行组合的平滑交互,而且在推理和学习中也非常有用。通过这个匕首,我们可以连接正向和反向推理(见定理6.6.3:反向推理是使用匕首的正向推理,反之亦然),并捕捉 Pearl 和Jeffrey 的更新规则之间的差异(见定理 6.7.4: Pearl 增加有效性,而Jeffrey 减少发散)

(从正确的事情中学习和从错误的事情中学习 https://arxiv.org/abs/2112.14045

更新(或调节或修改)概率分布的概念是(机器)学习和预测编码理论的基础。这样做的两种主要方法称为珀尔规则和杰弗里规则。在这里,我们第一次在数学上精确地区分了它们:Pearl 的规则增加了有效性(期望值),而 Jeffrey 的规则减少了(Kullback-Leibler)散度。这形成了从正确的事物中学习和从错误的事物中学习之间更普遍的区别的一个例子。这两种方法之间的区别在模拟认知场景中得到了说明。)

我们甚至敢想,概率称呼为p这种“马虎”最终会阻碍概率领域的发展,特别是在计算机科学中,计算机辅助推理需要一个清晰的语法和语义。例如,甚至很难用标准概率符号来表达上述定理 6.6.3 和 6.7.4。人们可以推测,在传统的概率论中,状态/分布是隐式的,因为在许多例子中,它们在背景中被用作固定的隐式假设。事实上,在数学符号中,人们倾向于忽略最不相关的(隐含的)参数——为了提高效率。但是概率计算的本质是状态转换,在这种情况下,明确地知道一个人在哪个阶段处于哪个状态变得非常重要。本书中发展的符号在这种情况下有所帮助——我们希望在许多其他情况下也是如此。

概率论除了有优美的结构,还有魔力。可以从以下两点中找到。

1 概率分布是可以更新的,这样就有可能吸收信息(证据)并从中学习。

基于数据的多次更新可用于训练,使得分布吸收越来越多的信息,并可随后用于预测或分类。

2 在一个产品空间中,联合发布的组件可以相互“倾听”,因此一个(产品)组件中的更新会在其他组件中产生交叉涟漪效应。这种连锁反应看起来像量子物理学中发生的事情,测量一个纠缠的量子系统的一部分会改变其他部分。

这两点的结合非常有力,形成了概率推理的基础。例如,如果我们知道两种现象是相关的,并且我们有关于其中一种现象的新信息,那么在更新之后,我们也了解到关于另一种现象的新信息。我们将看到,这种交叉涟漪效应可以用两种等价的方式来描述,从一个分量中有证据的联合分布开始。

• 我们可以使用“弱化-更新-边缘化”的方法,首先将证据从一个组件弱化到整个产品空间,使其符合联合分布并可用于更新;随后,我们将更新的状态边缘化到我们希望了解更多的组件。这就是通过联合分布的连锁反应变得明显的地方。

• 我们也可以使用“提取-推断”技术,首先从联合分布中提取条件概率(通道),然后根据证据沿着通道进行(向前或向后)推断。如果我们在贝叶斯网络中进行推理,当网络中某一点的信息在连接中上下传递,以得出网络中另一点的结论时,就会发生这种情况。

以下几个方面体现了本书的方法。

1 信道被用作概率推理的基石。(通信)信道的概念在其他地方广泛使用,有各种名称,如条件概率、随机矩阵、概率分类器、马尔可夫核、条件概率表(在贝叶斯网络中)、概率函数/计算、信号(在贝叶斯说服理论中),最后称为 Kleisli 映射(在范畴理论中)。通道可以顺序地和并行地组成,并且可以转换状态和谓词。对于所有相关的集合类型(列表、子集、多集、分布),例如对于非确定性的和概率计算, 都存在信道。然而,在关于集合类型的第一章之后,通道将以概率的形式专门用于分布。

2 多重集在捕捉各种形式的数据中起着核心作用,比如瓮中的彩球、从瓮中提取的数据、表格、后续学习步骤的输入等。多重集和分布之间的相互作用,特别是在学习中,是一个反复出现的主题。

3 状态(分布)被视为独立于谓词,并且是双重的。这些谓词是(隐式)概率逻辑的组成部分,例如合取和否定操作。状态实际上是不同的实体,有它们自己的操作,没有例如连接和否定。在本书中,谓词标准地以模糊(软的,非清晰的)形式出现,取值于单位区间[0,1]。沿着通道,可以向前传输状态,向后传输谓词。一个核心概念是有效性状态中的谓词,写为|=。它被标准地称为期望值。调节包括用谓词更新状态。

不仅仅是数学美学推动了本书的发展。如今,概率论构成了大部分大数据分析和人工智能的基础。这些领域具有越来越大的社会相关性,并为现代世界观提供了基础——更多地基于相关性而不是因果关系——也为许多现代决策提供了基础,这些决策可能会以深远的方式影响数十亿人的生活。越来越需要证明这种概率推理方法和决策的合理性,例如在欧洲通用数据保护条例(GDPR)提供的法律环境中。其叙文 71 是关于自动决策的,并谈到获得解释的权利:

因为驾驶蓝色汽车和拖欠抵押贷款之间存在关联,因为你驾驶蓝色汽车而拒绝你的抵押贷款申请是不可接受的。

这些和其他发展导致了一个新的领域,称为可解释的人工智能(XAI),它努力为决策提供人类可以容易理解的解释,没有偏见或歧视。虽然这本书不会对 XAI 本身有所贡献,但它旨在为这种解释提供一个坚实的数学基础

概率论领域的一个非常特殊的技术是条件反射,也称为信念更新,或简称为更新。它涉及到将证据纳入一种分配(状态),以便更好地分配符合证据。在传统概率中,这种条件只能通过计算条件概率的规则 P (B | A)间接获得。

在第六章中,我们将条件化公式化为一个显式操作,将一个状态 ω 和一个谓词 p 映射到一个新的更新状态 ω|p。一个关键结果是 ω|p 中 p 的有效性高于原始状态 ω 中 p 的有效性。这意味着我们已经从 p 中学习,并且将我们的状态(思想)从 ω 调整到 ω|p。

这个更新操作ω| p以模糊的形式形成一个动作(状态上的谓词),并满足贝叶斯规则。前进与后退的结合沿着通道的转换导致了正向推理(因果推理)和反向推理(证据推理)的技术。这些干扰技术在许多例子中都有说明,包括贝叶斯网络。反向推理规则也称为珀尔规则。原来存在一种替代的更新机制,叫做杰弗里规则。它可以给出完全不同的结果。杰弗里规则的正式化是基于通道方向的反转。这相当于将一个条件概率 P (y | x)转化为 P (x | y ),本质上是通过贝叶斯法则。这种贝叶斯反演也被称为信道的“匕首”,因为它满足希尔伯特空间(和量子理论)中的匕首运算(或共轭转置)的性质。

这一章包括这两个更新规则的不同目标的数学特征:珀尔的规则增加有效性,杰弗里的规则减少分歧。更通俗地说,一个人通过珀尔法则学习,改善进展顺利的地方,通过杰弗里法则学习,减少出错的地方。因此,杰弗里法则是一种纠错机制。这符合预测编码理论[64,23]的基本思想,即人类思维被视为通过减少预测误差来运行的贝叶斯预测引擎。

由于通道可以顺序和并行组合,我们可以使用图形技术来表示通道的组合。所谓的弦图已经在物理学和范畴理论中发展起来,以处理相关的组成结构(对称幺半群范畴)。第七章介绍了这些(定向)图形技术。它首先描述了字符串图。它们类似于用于贝叶斯网络的图,但是它们具有复制和丢弃的显式操作,因此更具表现力。但最重要的是,字符串图表有一个明确的语义,即在渠道方面。这一章在马尔可夫链和隐马尔可夫模型基础的基于信道的描述中说明了这些字符串图

原文:http://www.cs.ru.nl/B.Jacobs/PAPERS/ProbabilisticReasoning.pdf

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2022-03-12,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 CreateAMind 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
机器翻译
机器翻译(Tencent Machine Translation,TMT)结合了神经机器翻译和统计机器翻译的优点,从大规模双语语料库自动学习翻译知识,实现从源语言文本到目标语言文本的自动翻译,目前可支持十余种语言的互译。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档