Zipper_Haskell笔记13

一.不可变的数据结构

数据结构不可变,所以对其进行增、删、改等操作的结果只能是重新创建一份新的数据结构,例如:

反转List就像倒序一叠扑克牌,抽出最下面的一张放到新牌堆最上方,接着抽出倒数第二张放到它下面……所以,对牌堆进行倒序操作的结果实际上是造出了一个新牌堆。新牌堆仍由之前的牌构成,但与原牌堆没有任何联系,类似于状态丢弃,直接丢掉原牌堆,而不是维护修改,例如(实现数组反转的一般方法,用JS描述):

如果数据结构可变,数组反转就可以通过次元素交换来实现。二者的差异在于,可变的数据结构中,我们把数据结构当做可扩展复用的容器,对数据结构的操作就是对容器里的值进行增、删、改;不可变的数据结构中,我们把数据结构当做数据常量,无法扩展和复用,所以对数据结构的操作相当于重新创建一份很像但不太一样的数据。例如:

一条线被2个点分成3段,List中两个元素交换的结果就是第一段并上第二个点,并上中间那段,再并上第一个点和最后一段

(摘自一场函数式思维模式的洗礼)

对应的JS描述如下(仅关键部分):

相当麻烦,而且效率也不高,比如树结构的场景,改一个节点就需要建一棵新树,再改它旁边的节点又需要创建一棵新树……简单地给所有节点值都就需要创建棵完整树。实际上,局部的修改没必要重新创建整棵树,直到需要完整树的时候再去创建更合理一些。在数据结构不可变的情况下,这能实现吗?

二.在数据结构中穿梭

先造一颗二叉搜索树:

(及二叉搜索树的实现来自Monoid_Haskell笔记9)

树结构如下:

想要修改指定节点的话,需要知道两个东西:位置索引和新值。位置索引可以用访问路径来表示,例如:

那么函数的类型应该是这样的:

根据位置索引找到目标节点,换上新值即可,这样实现:

试玩一下,把改成,访问路径是:

符合预期,如果改完还想改呢?

可以把改完之后的完整树作为输入,再从根节点开始找到并改成:

能用,但存在2个问题:

改完之后生成的完整树是多余的

就是的左兄弟,不需要再从根开始找

实际上,我们希望的是:

不生成中间多余的完整树,在需要的时候(比如一系列修改操作之后)才生成完整树

能够方便地进行局部修改(改左右兄弟、父级子级),而不用关注完整树

要对一棵子树进行多次修改,修改完毕后还要能生成完整树,怎么才能做到?

进行局部修改的同时要保留其结构上下文信息。比如修改右子树时,关注点是:

就二叉树而言,结构上下文信息由两部分组成,父节点和兄弟节点:

右子树加上这两部分信息,就能够得到以父节点为根的完整子树。同样,如果父节点也有其父节点和兄弟节点的信息,就能接着向上恢复子树,走到根的时候就能得到完整树。实际上,只要拥有足够的结构上下文信息,就能在树中上下左右任意穿梭,并且随时能够停下来重建完整树

先定义结构上下文信息:

用来记录结构上下文信息,其中表示父节点的值,表示右兄弟,这是向上恢复子树所需的最小信息,一点不多余。与之前的类似,同样用来表示访问路径,只是路径的每一步除了记录方向,还记录了相应的上下文信息,包括父节点和兄弟节点

接着实现“任意穿梭”:

走两步试玩一下,还走之前的场景,先找,再找,即先向左向右,再上去,最后向左:

找到了所在子树,并且保留有完整的访问路径(的左兄弟的左兄弟)

要重建完整树的话,只需要原路走回到树根,这样做:

验证一下:

能够自由穿梭,还能随时重建完整树之后,就变得很简单:

再来一遍,先把改成,再把改成:

与之前结果一致。看起来不太清楚,利用工具函数:

简单变换一下,以更自然的方式来描述:

从树根开始,向左走,向右走,改成,再向上走,向左走,改成,一系列操作相当自然,没有感受到数据结构不可变的限制

List

实际上,List也能以这种更自然的方式来操作,只要带上结构上下文信息即可

对于List来说,只有左右2个方向,比树的场景简单许多:

左右穿梭、重建完整List、修改元素都很容易实现:

试玩一下:

把第4个元素改成了,第2个元素改成了。对比之前的做法:

二者的差异在于,前者支持以符合直觉的方式遍历、修改元素,对不可变的限制无感知

三.Zipper是什么东西

上面我们定义的、都是Zipper,正规描述如下:

The Zipper is an idiom that uses the idea of “context” to the means of manipulating locations in a data structure.

用“上下文”的思想来处理数据结构中的位置,习惯叫法是Zipper(拉链)。为什么叫“拉链”呢?

就是拉链,非常形象。把List当作拉链,锁头是一个游标(cursor,或者理解成指针),游标所指的位置上的元素就是当前元素,其余元素是其上下文。锁头向右拉开,向左拉住(想象拉文件袋封口的动作),对应到数据结构操作中就是,向右访问新元素,拉到最右端就是遍历,向左访问历史元素,拉到最左端就是重建完整List

类似的,也可以这样理解,向左向右拉开,访问新元素,向上拉住,访问历史元素,拉到顶部就是重建完整树

具体地,Zipper可以据其通用程度分为:

针对特定数据结构的Zipper:如ListZipper、TravelTree、TravelBTree

通用Zipper:如Zipper Monad、Generic Zipper

针对具体数据结构的Zipper我们已经实现过两个了(把换成即可),大致思路是:

Zipper, the functional cursor into a data structure, is itself a data structure, derived from the original one. The derived data type D’ for the recursive data type D is D with exactly one hole. Filling-in the hole — integrating over all positions of the hole — gives the data type D back.

从给定的数据结构派生出Zipper结构,具体做法是把原数据结构拆成两部分,子结构(作为值)和带“洞”的结构(作为值的结构上下文,有“洞”是因为从原完整结构上抠掉了值所在的子结构),二者拼起来恰好就是原完整结构,如下图:

zipper-hole

Zipper Monad

The Zipper Monad is a generic monad for navigating around arbitrary data structures. It supports movement, mutation and classification of nodes (is this node the top node or a child node?, etc).

除了支持移动,修改外,还能区分节点类型。基本实现如下:

,通过几个monadic函数来遍历、修改:

P.S.本来是给Zipper设计的通用Monad,结果发现并不需要:

It’s designed for use with The Zipper but in fact there is no requirement to use such an idiom.

目前好像被当做树结构专用的了:

Zipper monad is a monad which implements the zipper for binary trees.

Generic Zipper

另一种通用Zipper:

Generic Zipper: the context of a traversal

把Zipper看做遍历操作的上下文,与之前的思路不同:

We advocate a different view, emphasizing not the result of navigating through a data structure to a desired item and extracting it, but the process of navigation.

不强调移动到数据结构中的某个位置,访问想要的东西,而只关注移动的过程:

Each data structure comes with a method to enumerate its components, representing the data structure as a stream of the nodes visited during the enumeration. To let the user focus on a item and submit an update, the enumeration process should yield control to the user once it reached an item.

从遍历的角度看,数据结构就是枚举过程中被访问到的节点形成的流。那么,要关注某个节点并更新的话,枚举过程应该在访问到该节点时把控制权交回给用户,例如:

(具体见ZipperTraversable)

P.S.这个思路像极了JS里的生成器,每走一步都喘口气看看要不要修改元素,或者停止遍历:

As Chung-chieh Shan aptly put it, ‘zipper is a suspended walk.’

参考资料

Zipper

Control.Zipper

Control.Monad.Zipper

Haskell error: Couldn’t match type ‘a’ with ‘b’

联系ayqy

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20180722G0CQFB00?refer=cp_1026
  • 腾讯「云+社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。

扫码关注云+社区

领取腾讯云代金券