前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >并查集的原理及实现

并查集的原理及实现

作者头像
利刃大大
发布2023-04-12 14:24:56
4260
发布2023-04-12 14:24:56
举报
文章被收录于专栏:编程语言/linux/算法

Ⅰ. 并查集原理

在一些应用问题中,需要 n 个不同的元素划分成一些不相交的集合开始时,每个元素自成一个单元素集合,然后按一定的规律将归于同一组元素的集合合并。在此过程中要反复用到查询某一个元素归属于那个集合的运算。适合于描述这类问题的抽象数据类型称为并查集 (union-findset)

比如:某公司今年校招全国总共招生10人,西安招4人,成都招3人,武汉招3人,10个人来自不同的学校,起先互不相识,每个学生都是一个独立的小团体,现给这些学生进行编号:{0, 1, 2, 3, 4, 5, 6, 7, 8, 9}; 给以下数组用来存储该小集体,数组中的数字代表:该小集体中具有成员的个数。(负号下文解释)

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-T5Da9ysk-1671587195794)(../../img/image-20221112204522109.png)]
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-T5Da9ysk-1671587195794)(../../img/image-20221112204522109.png)]

毕业后,学生们要去公司上班,每个地方的学生自发组织成小分队一起上路,于是:

西安学生小分队s1={0,6,7,8},成都学生小分队s2={1,4,9},武汉学生小分 s3={2,3,5} 就相互认识了,10个人形成了三个小团体。假设右三个群主0,1,2担任队长,负责大家的出行。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-wgrPR6ZF-1671587195795)(../../img/image-20221112210612281.png)]
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-wgrPR6ZF-1671587195795)(../../img/image-20221112210612281.png)]

一趟火车之旅后,每个小分队成员就互相熟悉,称为了一个朋友圈。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-Qvou3PTB-1671587195795)(../../img/image-20221112210626634.png)]
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-Qvou3PTB-1671587195795)(../../img/image-20221112210626634.png)]

从上图可以看出:编号6,7,8同学属于0号小分队,该小分队中有4人(包含队长0);编号为4和9的同学属于1号小分队,该小分队有3人(包含队长1),编号为3和5的同学属于2号小分队,该小分队有3个人(包含队长1)。

仔细观察数组中内融化,可以得出以下结论:

  1. 数组的下标对应集合中元素的编号
  2. 数组中如果为负数,负号代表根,数字代表该集合中元素个数
  3. 数组中如果为非负数,代表该元素双亲在数组中的下标

在公司工作一段时间后,西安小分队中8号同学与成都小分队1号同学奇迹般的走到了一起,两个小圈子的学生相互介绍,最后成为了一个小圈子:

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-d7FYYcPh-1671587195796)(../../img/image-20221112211942638.png)]
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-d7FYYcPh-1671587195796)(../../img/image-20221112211942638.png)]

现在0集合有7个人,2集合有3个人,总共两个朋友圈。

通过以上例子可知,并查集一般可以解决一下问题:

  1. 查找元素属于哪个集合 沿着数组表示树形关系以上一直找到根(即:树中中元素为负数的位置)
  2. 查看两个元素是否属于同一个集合 沿着数组表示的树形关系往上一直找到树的根,如果根相同表明在同一个集合,否则不在
  3. 将两个集合归并成一个集合
    • 将两个集合中的元素合并
    • 将一个集合名称改成另一个集合的名称
  4. 集合的个数 遍历数组,数组中元素为负数的个数即为集合的个数。

Ⅱ. 并查集的实现

其中在合并的时候做了一些小优化

  • 让小集合合并到大集合中去,这样子的话合并后层数不会偏差太多
  • 进行 路径压缩,减少层数(使用迭代,用递归容易溢出)
    • 其实原理就是在 FindRoot 的过程中,我们直接将路径上的节点的双亲变成根节点即可~
代码语言:javascript
复制
#pragma once
#include <vector>
#include <iostream>
using namespace std;

class UnionFindSet
{
public:
	UnionFindSet(size_t n)
		:_ufs(n, -1)
	{}

	// 将两个集合并起来
	void Union(int x1, int x2)
	{
		// 先找到两个集合的根
		int root1 = FindRoot(x1);
		int root2 = FindRoot(x2);

		// 如果本身就是一个集合,那就不用合并
		if (root1 == root2)
			return;

		// 做一下优化,让小的往大的集合合并
		if (abs(_ufs[root1]) < abs(_ufs[root2]))
			swap(root1, root2);
		
		// 将新的根的值也就是这个集合总个数更新
		_ufs[root1] += _ufs[root2];

		// 将他们链接起来,这里统一把第二个合并到第一个
		_ufs[root2] = root1;
	}

	// 找一个节点的根的值
	int FindRoot(int x)
	{
		int root = x;
		while (_ufs[root] >= 0)
		{
			root = _ufs[root];
		}

		// 进行路径压缩优化
		while (_ufs[x] >= 0)
		{
			// 注意要先用tmp将x的双亲保存下来,再让x的双亲变成根节点
			int tmp = _ufs[x];
			_ufs[x] = root;

			// x不断更新为路径上的双亲,直到遇到根节点
			x = tmp;
		}

		return root;
	}

	// 检测是否在同一个集合
	bool IsInSameSet(int x1, int x2)
	{
		return FindRoot(x1) == FindRoot(x2);
	}

	// 求一共有几个集合
	size_t SetSize(int x)
	{
		size_t n = 0;
		for (size_t i = 0; i < _ufs.size(); ++i)
		{
			if (_ufs[i] < 0)
				n++;
		}
		return n;
	}
private:
	vector<int> _ufs; // 存放节点双亲下标(负数代表根节点)
};
本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2022-12-21,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • Ⅰ. 并查集原理
  • Ⅱ. 并查集的实现
相关产品与服务
对象存储
对象存储(Cloud Object Storage,COS)是由腾讯云推出的无目录层次结构、无数据格式限制,可容纳海量数据且支持 HTTP/HTTPS 协议访问的分布式存储服务。腾讯云 COS 的存储桶空间无容量上限,无需分区管理,适用于 CDN 数据分发、数据万象处理或大数据计算与分析的数据湖等多种场景。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档