Tarjan算法

tarjan算法

一个关于有向图的联通性的神奇算法。

基于DFS(迪法师)算法,深度优先搜索一张有向图。

名词的储备,有备无患

强连通(strongly connected):

在一个有向图G里,设两个点 a、b。发现,由a有一条路可以走到b,由b又有一条路可以走到a,我们就叫这两个顶点(a,b)强连通。

强连通图(Strongly Connected Graph):

如果在一个有向图G中,每两个点都强连通,我们就叫这个图,强连通图。

强连通分量(strongly connected components):

在一个有向图G中,有一个子图,这个子图每2个点都满足强连通,我们就叫这个子图叫做强连通分量(分量是指把一个向量分解成几个方向的向量的和,在那些方向上的向量就叫做该向量(未分解前的向量)的分量)

解答树:

解答树是一个可以来表达出递归枚举的方式的树(图),其实也可以说是递归图。反正都是一个作用,一个展示从“什么都没有做”开始到“所有结求出来”逐步完成的过程!过程!过程!重要的事情说三遍!

实战前,剥个栗子吃吃

举个简单的栗子:

比如在上方这个图中:点1与点2互相都有路径到达对方,所以它们强连通.

而在这个有向图中,点1 2 3组成的这个子图,是整个有向图中的强连通分量。

tarjan算法精髓

tarjan算法,之所以用DFS就是因为它将每一个强连通分量作为搜索树上的一个子树。而这个图,就是一个完整的搜索树。为了使这颗搜索树在遇到强连通分量的节点的时候能顺利进行,每个点都有两个参数。 1.DFN[]作为这个点搜索的次序编号(时间戳),简单来说就是第几个被搜索到的(每个点的时间戳都不一样)。 2.LOW[]作为每个点在这颗树中的最小的子树的根,每次保证最小,like它的父亲结点的时间戳这种感觉。如果它自己的LOW[]最小,那这个点就应该从新分配,变成这个强连通分量子树的根节点。(ps:每次找到一个新点,这个点LOW[] =DFN[])

而为了存储整个强连通分量,这里挑选的容器是:堆栈。每次一个新节点出现,就进栈,如果这个点有出度就继续往下找,直到找到底。每次返回上来都看一看子节点与这个节点的LOW值,谁小就取谁,保证最小的子树根。如果找到DFN[]==LOW[]就说明这个节点是这个强连通分量的根节点(毕竟这个LOW[]值是这个强连通分量里最小的)。最后找到强连通分量的节点后,就将这个栈里,比此节点后进来的节点全部出栈,它们就组成一个全新的强连通分量。

来一段伪代码压压惊

tarjan(u){
    DFN[u]=Low[u]=++Index //为节点u设定次序编号和Low初值
    Stack.push(u) //将节点u压入栈中
    for each (u, v) in E //枚举每一条边
      if (v is not visted) //如果节点v未被访问过
         tarjan(v) //继续向下找
         Low[u] = min(Low[u], Low[v])
      else if (v in S) //如果节点u还在栈内
         Low[u] = min(Low[u], DFN[v])
    if (DFN[u] == Low[u]) //如果节点u是强连通分量的根
    repeat v = S.pop  //将v退栈,为该强连通分量中一个顶点
    print v
    until (u== v)
}

再来一张有向图尝尝鲜

通过这个有向图,我们就一点一点来模拟整个算法:

从1进入 DFN[1]=LOW[1]=++index ----1 入栈 1 由1进入2 DFN[2]=LOW[2]=++index ----2 入栈 1 2 之后由2进入3 DFN[3]=LOW[3]=++index ----3 入栈 1 2 3 之后由3进入 6 DFN[6]=LOW[6]=++index ----4 入栈 1 2 3 6

之后你会突然发现:嗯???6无出度,之后判断 DFN[6]==LOW[6],说明6是个强连通分量的根节点:6及6以后的点出栈。则栈: 1 2 3 之后退回节点3,Low[3]=min(Low[3], Low[6]) LOW[3]还是 3,节点3:也没有再能延伸的边了,判断 DFN[3]==LOW[3],说明3是个强连通分量的根节点:3及3以后的点出栈。则栈: 1 2 之后退回:节点2 嗯?!往下到节点5 DFN[5]=LOW[5]=++index -----5 入栈 1 2 5

ps:你会发现在有向图旁边的那个丑的(划掉)搜索树用红线剪掉的子树,那个就是强连通分量子树。每次找到一个。直接:一剪子下去。半个子树就没有了。。。

结点5 往下找,发现节点6 DFN[6]有值,被访问过。就不管它。 继续5 往下找,找到了节点1 ,然而尴尬的是:DFN[1]被访问过并且还在栈中,说明1还在这个强连通分量中,值得发现。 Low[5] = min(Low[5], DFN[1]) 确定关系,在这棵强连通分量树中,5节点要比1节点出现的晚。所以5是1的子节点。因此LOW[5]= 1

由5继续回到2 Low[2] = min(Low[2], Low[5]) LOW[2]=1; 由2继续回到1 判断 Low[1] = min(Low[1], Low[2]) LOW[1]还是 1 1还有边没有走过。发现节点4,访问节点4 DFN[4]=LOW[4]=++index ----6 入栈 1 2 5 4 由节点4,走到5,发现5被访问过了,5还在栈里, Low[4]= min(Low[4], DFN[5]) LOW[4]=5 说明4是5的一个子节点。

由4回到1.

回到1,判断 Low[1] = min(Low[1], Low[4]) LOW[1]还是 1 。

判断 LOW[1] == DFN[1] 诶?!相等了 说明以1为根节点的强连通分量已经找完了。 将栈中1以及1之后进栈的所有点,都出栈。 栈 :(鬼都没有了)

这个时候就完了吗?!

你以为就完了吗?!

然而并没有完,万一你只走了一遍tarjan整个图没有找完怎么办呢?!

所以。tarjan的调用最好在循环里解决。

like 如果这个点没有被访问过,那么就从这个点开始tarjan一遍。

因为这样好让每个点都被访问到。

终极大BOSS测试

输入:

一个图有向图。

输出:

它每个强连通分量。

这个图就是刚才讲的那个图。一模一样。

input:

6 8

1 3

1 2

2 4

3 4

3 5

4 6

4 1

5 6

output:

6

5

3 4 2 1

参考代码:

#include<cstdio>
#include<algorithm>
#include<string.h>
using namespace std;
struct node { int v,next;}edge[1001];
int DFN[1001],LOW[1001];
int stack[1001],heads[1001],visit[1001],cnt,tot,index;
void add(int x,int y)
{   edge[++cnt].next=heads[x];
    edge[cnt].v = y    heads[x]=cnt;   return ; }
void tarjan(int x)//代表第几个点在处理。递归的是点。
{    DFN[x]=LOW[x]=++tot;// 新进点的初始化。
    stack[++index]=x;//进站
    visit[x]=1;//表示在栈里
    for(int i=heads[x];i!=-1;i=edge[i].next)
    {   if(!DFN[edge[i].v]) {//如果没访问过
            tarjan(edge[i].v);//往下进行延伸,开始递归
            LOW[x]=min(LOW[x],LOW[edge[i].v]);
    //递归出来,比较谁是谁的儿子/父亲,就是树的对应关系,涉及到强连通分量子树最小根的事情。
        }
        else if(visit[edge[i].v ]){  //如果访问过,并且还在栈里。
            LOW[x]=min(LOW[x],DFN[edge[i].v]);
    //比较谁是谁的儿子/父亲。就是链接对应关系        
        }
    }
    if(LOW[x]==DFN[x]) //发现是整个强连通分量子树里的最小根。
    {
        do{
            printf("%d ",stack[index]);
            visit[stack[index]]=0;            
                  index--;
        }while(x!=stack[index+1]);//出栈,并且输出
        printf("\n");
    }
    return ;
}

int main()
{     memset(heads,-1,sizeof(heads));
    int n,m;
    scanf("%d%d",&n,&m);
    int x,y;
    for(int i=1;i<=m;i++)
    {
        scanf("%d%d",&x,&y);
        add(x,y);
    }
    for(int i=1;i<=n;i++)
        if(!DFN[i])  tarjan(i);
    //当这个点没有访问过,就从此点开始。防止图没走完
    return 0;
}

不知道你是否真的理解了Tarjan算法,

若还有疑问,欢迎在留言板处提问哦!

推荐阅读

  1. 普里姆(Prim)算法
  2. Java 机器学习库Smile实战(一)SVM

原文发布于微信公众号 - 机器学习算法全栈工程师(Jeemy110)

原文发表时间:2017-08-18

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏小樱的经验随笔

从零基础学三分查找

今晚是我们学长第二次讲课,讲了一个三分!认真听了一下,感觉不是很难,可能会比二分还简单些!我就把上课讲的内容归纳为一篇文章概述吧!以后也会重点讲解的! 简单点说...

38710
来自专栏程序生活

卡特兰数简介原理性质应用参考:

简介 卡特兰数又称卡塔兰数,卡特兰数是组合数学中一个常出现在各种计数问题中的数列。 卡塔兰数的一般项公式为: ? 卡特兰公式 其前20项为:1, 1, 2, ...

3404
来自专栏文武兼修ing——机器学习与IC设计

算法复杂度分析与最大子串问题算法复杂度分析最大子序列问题

算法复杂度分析 算法复杂度基本定义 算法复杂度分析基于以下四条定义: 如果存在常数c与$n_{0}$使$N \geq n_{0} $时,有$T(N) \leq ...

2396
来自专栏WD学习记录

Python数据结构与算法笔记(5)

邻接矩阵优点是简单,对于小图,很容易看到哪些节点连接到其他节点。但是大多数单元格是空的,即稀疏。

753
来自专栏数据结构与算法

BZOJ3143: [Hnoi2013]游走(期望DP 高斯消元)

Description 一个无向连通图,顶点从1编号到N,边从1编号到M。  小Z在该图上进行随机游走,初始时小Z在1号顶点,每一步小Z以相等的概率随机选 择当...

3766
来自专栏小樱的经验随笔

HDU 2080 夹角有多大II

夹角有多大II Time Limit: 1000/1000 MS (Java/Others)    Memory Limit: 32768/32768 K (J...

26210
来自专栏潇涧技术专栏

Python Algorithms - C9 Graphs

Python算法设计篇(9) Chapter 9: From A to B with Edsger and Friends

522
来自专栏技术换美食换不换

Greedy & Violent

1 2 3//坐标缩小后就可以更方便的选择 double pos = (double)i / n * (n + m);//原来雕像的位置 ans += f...

511
来自专栏数据结构与算法

学大伟业 国庆Day2

期望得分:30+100+0=130 实际得分:30+100+20=150 忍者钩爪 (ninja.pas/c/cpp) 【问题描述】 小Q是一名酷爱钩爪的忍者,...

4334
来自专栏聊聊技术

原 初学算法-快速排序与线性时间选择(De

3066

扫码关注云+社区