dsu on tree入门

先瞎扯几句

说起来我跟这个算法好像还有很深的渊源呢qwq。当时在学业水平考试的考场上,题目都做完了不会做,于是开始xjb出题。突然我想到这么一个题

看起来好像很可做的样子,然而直到考试完我都只想出来一个莫队的暴力。当时我想知道有没有比莫队更优的做法,和zbq讨论了半天也只能搞出一个$O(nlog^2n)$的平衡树启发式合并

然后!!我就把这题出给校内互测了!!没错,当时是用莫队当的标算!

结果!mjt用一个假的$O(n)$算法艹过去了因为数据特别水

后来我打算把这题出给另一场比赛,结果到了前一天晚上造数据的时候我发现不太对,然后把mjt的算法hack了。

去UOJ群里一问才知道这玩意儿是个dsu on tree的sb题。

当时我就这个表情

自己还是太年轻啊%>_<%

好了好了,来讲算法吧

Dsu on tree

简介

dsu on tree跟dsu(并查集)是没啥关系,可能是借用了一波启发式合并的思想??

它是用来解决一类树上询问问题,一般这种问题有两个特征

1、只有对子树的询问

2、没有修改

一般这时候就可以强上dsu on tree了

算法流程

考虑暴力怎么写:遍历每个节点—把子树中的所有颜色暴力统计出来更新答案—消除该节点的贡献—继续递归

这肯定是$O(n^2)$的。

dsu on tree巧妙的利用了轻重链剖分的性质,把复杂度降到了$O(nlogn)$

啥啥啥?你不知道啥叫轻重链剖分?

一句话:对于树上的一个点,与其相连的边中,连向的节点子树大小最大的边叫做重边,其他的边叫轻边

 dsu on tree的算法流程是这样的:

对于节点$i$:

  • 遍历每一个节点
    • 递归解决所有的轻儿子,同时消除递归产生的影响
  • 递归重儿子,不消除递归的影响
  • 统计所有轻儿子对答案的影响
  • 更新该节点的答案
  • 删除所有轻儿子对答案的影响

主体框架长这样

可能你先在会想:为什么都是暴力统计答案?这样复杂度不是$O(n^2)$的么?

那简单的来证一下这东西的复杂度

复杂度

性质:一个节点到根的路径上轻边个数不会超过$logn$条

证明:

设根到该节点有$x$条轻边,该节点的大小为$y$,根据轻重边的定义,轻边所连向的点的大小不会成为该节点总大小的一般。

这样每经过一条轻边,$y$的上限就会$ / 2$,因此$y < \frac{n}{2^x}$

因为$n > 2^x$,所以$x < logn$

然而这条性质并不能解决问题。

我们考虑一个点会被访问多少次

一个点被访问到,只有两种情况

1、在暴力统计轻边的时候访问到。

根据前面的性质,该次数$< logn$

2、通过重边 / 在遍历的时候被访问到

显然只有一次

如果统计一个点的贡献的复杂度为$O(1)$的话,该算法的复杂度为$O(nlogn)$

模板题

cf600E. Lomsat gelral

 题意:给出一个树,求出每个节点的子树中出现次数最多的颜色的编号和

 dsu on tree的模板题,暴力统计即可

#include<bits/stdc++.h>
#define LL long long 
using namespace std;
const int MAXN = 1e5 + 10;
inline int read() {
    char c = getchar(); int x = 0, f = 1;
    while(c < '0' || c > '9') {if(c == '-') f = -1; c = getchar();}
    while(c >= '0' && c <= '9') x = x * 10 + c - '0', c = getchar();
    return x * f;
}
int N, col[MAXN], son[MAXN], siz[MAXN], cnt[MAXN], Mx, Son;
LL sum = 0, ans[MAXN];
vector<int> v[MAXN];
void dfs(int x, int fa) {
    siz[x] = 1;
    for(int i = 0; i < v[x].size(); i++) {
        int to = v[x][i];
        if(to == fa) continue;
        dfs(to, x);
        siz[x] += siz[to];
        if(siz[to] > siz[son[x]]) son[x] = to;//轻重链剖分
    }
}
void add(int x, int fa, int val) {
    cnt[col[x]] += val;//这里可能会因题目而异
    if(cnt[col[x]] > Mx) Mx = cnt[col[x]], sum = col[x];
    else if(cnt[col[x]] == Mx) sum += (LL)col[x];
    for(int i = 0; i < v[x].size(); i++) {
        int to = v[x][i];
        if(to == fa || to == Son) continue;
        add(to, x, val);
    }
}
void dfs2(int x, int fa, int opt) {
    for(int i = 0; i < v[x].size(); i++) {
        int to = v[x][i];
        if(to == fa) continue;
        if(to != son[x]) dfs2(to, x, 0);//暴力统计轻边的贡献,opt = 0表示递归完成后消除对该点的影响
    }
    if(son[x]) dfs2(son[x], x, 1), Son = son[x];//统计重儿子的贡献,不消除影响

    add(x, fa, 1); Son = 0;//暴力统计所有轻儿子的贡献
    ans[x] = sum;//更新答案
    if(!opt) add(x, fa, -1), sum = 0, Mx = 0;//如果需要删除贡献的话就删掉
}
int main() {
    N = read();
    for(int i = 1; i <= N; i++) col[i] = read();
    for(int i = 1; i <= N - 1; i++) {
        int x = read(), y = read();
        v[x].push_back(y); v[y].push_back(x);
    }
    dfs(1, 0);
    dfs2(1, 0, 0);
    for(int i = 1; i <= N; i++) printf("%I64d ", ans[i]);
    return 0;
}

参考资料

[Codeforces600E]Lomsat gelral(dsu on the tree)

[trick]dsu on tree

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏社区的朋友们

【小程序码设计篇】菊花绽放

2017 年四月,微信正式推出了小程序码。小程序码设计深度解析,为何长得像菊花,进行二次美化应该注意什么,本文为你揭晓!

6K10
来自专栏数据结构与算法

网络最大流算法—最高标号预流推进HLPP

吐槽 这个算法。。 怎么说........ 学来也就是装装13吧。。。。 长得比EK丑 跑的比EK慢 写着比EK难 思想 大家先来猜一下这个算法的思想吧:joy...

41760
来自专栏Python与爬虫

[资源分享]计算机科学速成课

推荐 程序员的你一定要看,不是程序员的也可以看看,我已经安利刚中考完的我妹妹看了(培养程序媛...)

26530
来自专栏大数据文摘

十分钟视频,手把手教你用Python撒情人节狗粮的正确姿势

46840
来自专栏数据派THU

手把手教你用R处理常见的数据清洗问题(附步骤解析、R语言代码)

R是进行运算、清洗、汇总及生成概率统计等数据处理的一个绝佳选择。此外,由于它独立于平台、短期内不会消失,所以生成的程序可以在任何地方运行。并且,它具备非常棒的辅...

61630
来自专栏数据小魔方

R语言数据清洗实战——世界濒危遗产地数据爬取案例

最近重复新翻阅R语言领域唯一一本关于网络数据采集的参考书——《基于R语言的自动数据收集》,开篇就是一个数据爬取的案例。 尽管之前已经粗略的看过一遍,但是仍感书中...

67360
来自专栏大数据挖掘DT机器学习

R语言绘制中国地图,并展示流行病学数据

本文作者:姜晓东,博士毕业于上海交通大学,目前任教于湖南师范大学医学院,专业神经毒理学。 流行病学的数据讲究“三间分布”,即人群分布、时间分布和空间分布。其中...

4.2K60
来自专栏PPV课数据科学社区

【完整案例】如何用R实现空间数据可视化

image.png 流行病学的数据讲究“三间分布”,即人群分布、时间分布和空间分布。其中的“空间分布”最好是在地图上展示,才比较清楚。R软件集统计分析与高级...

1.3K70
来自专栏Crossin的编程教室

【每周一坑】图像的指纹:数字水印 + 【解答】鸡兔同笼

曾经有过这样的新闻:某公司的员工将内网论坛上的言论截屏发布到互联网上,引发了热议。于是公司通过截图定位到了员工的身份,将其开除。

23320
来自专栏点滴积累

JS前端三维地球渲染——中国各城市航空路线展示

前言 我还从来没有写过有关纯JS的文章(上次的矢量瓦片展示除外,相对较简单。),自己也学习过JS、CSS等前端知识,了解JQuery、React等框架,但是自己...

92360

扫码关注云+社区

领取腾讯云代金券