Tarjan算法

tarjan算法

一个关于有向图的联通性的神奇算法。

基于DFS(迪法师)算法,深度优先搜索一张有向图。

名词的储备,有备无患

强连通(strongly connected):

在一个有向图G里,设两个点 a、b。发现,由a有一条路可以走到b,由b又有一条路可以走到a,我们就叫这两个顶点(a,b)强连通。

强连通图(Strongly Connected Graph):

如果在一个有向图G中,每两个点都强连通,我们就叫这个图,强连通图。

强连通分量(strongly connected components):

在一个有向图G中,有一个子图,这个子图每2个点都满足强连通,我们就叫这个子图叫做强连通分量(分量是指把一个向量分解成几个方向的向量的和,在那些方向上的向量就叫做该向量(未分解前的向量)的分量)

解答树:

解答树是一个可以来表达出递归枚举的方式的树(图),其实也可以说是递归图。反正都是一个作用,一个展示从“什么都没有做”开始到“所有结求出来”逐步完成的过程!过程!过程!重要的事情说三遍!

实战前,剥个栗子吃吃

举个简单的栗子:

比如在上方这个图中:点1与点2互相都有路径到达对方,所以它们强连通.

而在这个有向图中,点1 2 3组成的这个子图,是整个有向图中的强连通分量。

tarjan算法精髓

tarjan算法,之所以用DFS就是因为它将每一个强连通分量作为搜索树上的一个子树。而这个图,就是一个完整的搜索树。为了使这颗搜索树在遇到强连通分量的节点的时候能顺利进行,每个点都有两个参数。 1.DFN[]作为这个点搜索的次序编号(时间戳),简单来说就是第几个被搜索到的(每个点的时间戳都不一样)。 2.LOW[]作为每个点在这颗树中的最小的子树的根,每次保证最小,like它的父亲结点的时间戳这种感觉。如果它自己的LOW[]最小,那这个点就应该从新分配,变成这个强连通分量子树的根节点。(ps:每次找到一个新点,这个点LOW[] =DFN[])

而为了存储整个强连通分量,这里挑选的容器是:堆栈。每次一个新节点出现,就进栈,如果这个点有出度就继续往下找,直到找到底。每次返回上来都看一看子节点与这个节点的LOW值,谁小就取谁,保证最小的子树根。如果找到DFN[]==LOW[]就说明这个节点是这个强连通分量的根节点(毕竟这个LOW[]值是这个强连通分量里最小的)。最后找到强连通分量的节点后,就将这个栈里,比此节点后进来的节点全部出栈,它们就组成一个全新的强连通分量。

来一段伪代码压压惊

tarjan(u){
    DFN[u]=Low[u]=++Index //为节点u设定次序编号和Low初值
    Stack.push(u) //将节点u压入栈中
    for each (u, v) in E //枚举每一条边
      if (v is not visted) //如果节点v未被访问过
         tarjan(v) //继续向下找
         Low[u] = min(Low[u], Low[v])
      else if (v in S) //如果节点u还在栈内
         Low[u] = min(Low[u], DFN[v])
    if (DFN[u] == Low[u]) //如果节点u是强连通分量的根
    repeat v = S.pop  //将v退栈,为该强连通分量中一个顶点
    print v
    until (u== v)
}

再来一张有向图尝尝鲜

通过这个有向图,我们就一点一点来模拟整个算法:

从1进入 DFN[1]=LOW[1]=++index ----1 入栈 1 由1进入2 DFN[2]=LOW[2]=++index ----2 入栈 1 2 之后由2进入3 DFN[3]=LOW[3]=++index ----3 入栈 1 2 3 之后由3进入 6 DFN[6]=LOW[6]=++index ----4 入栈 1 2 3 6

之后你会突然发现:嗯???6无出度,之后判断 DFN[6]==LOW[6],说明6是个强连通分量的根节点:6及6以后的点出栈。则栈: 1 2 3 之后退回节点3,Low[3]=min(Low[3], Low[6]) LOW[3]还是 3,节点3:也没有再能延伸的边了,判断 DFN[3]==LOW[3],说明3是个强连通分量的根节点:3及3以后的点出栈。则栈: 1 2 之后退回:节点2 嗯?!往下到节点5 DFN[5]=LOW[5]=++index -----5 入栈 1 2 5

ps:你会发现在有向图旁边的那个丑的(划掉)搜索树用红线剪掉的子树,那个就是强连通分量子树。每次找到一个。直接:一剪子下去。半个子树就没有了。。。

结点5 往下找,发现节点6 DFN[6]有值,被访问过。就不管它。 继续5 往下找,找到了节点1 ,然而尴尬的是:DFN[1]被访问过并且还在栈中,说明1还在这个强连通分量中,值得发现。 Low[5] = min(Low[5], DFN[1]) 确定关系,在这棵强连通分量树中,5节点要比1节点出现的晚。所以5是1的子节点。因此LOW[5]= 1

由5继续回到2 Low[2] = min(Low[2], Low[5]) LOW[2]=1; 由2继续回到1 判断 Low[1] = min(Low[1], Low[2]) LOW[1]还是 1 1还有边没有走过。发现节点4,访问节点4 DFN[4]=LOW[4]=++index ----6 入栈 1 2 5 4 由节点4,走到5,发现5被访问过了,5还在栈里, Low[4]= min(Low[4], DFN[5]) LOW[4]=5 说明4是5的一个子节点。

由4回到1.

回到1,判断 Low[1] = min(Low[1], Low[4]) LOW[1]还是 1 。

判断 LOW[1] == DFN[1] 诶?!相等了 说明以1为根节点的强连通分量已经找完了。 将栈中1以及1之后进栈的所有点,都出栈。 栈 :(鬼都没有了)

这个时候就完了吗?!

你以为就完了吗?!

然而并没有完,万一你只走了一遍tarjan整个图没有找完怎么办呢?!

所以。tarjan的调用最好在循环里解决。

like 如果这个点没有被访问过,那么就从这个点开始tarjan一遍。

因为这样好让每个点都被访问到。

终极大BOSS测试

输入:

一个图有向图。

输出:

它每个强连通分量。

这个图就是刚才讲的那个图。一模一样。

input:

6 8

1 3

1 2

2 4

3 4

3 5

4 6

4 1

5 6

output:

6

5

3 4 2 1

参考代码:

#include<cstdio>
#include<algorithm>
#include<string.h>
using namespace std;
struct node { int v,next;}edge[1001];
int DFN[1001],LOW[1001];
int stack[1001],heads[1001],visit[1001],cnt,tot,index;
void add(int x,int y)
{   edge[++cnt].next=heads[x];
    edge[cnt].v = y    heads[x]=cnt;   return ; }
void tarjan(int x)//代表第几个点在处理。递归的是点。
{    DFN[x]=LOW[x]=++tot;// 新进点的初始化。
    stack[++index]=x;//进站
    visit[x]=1;//表示在栈里
    for(int i=heads[x];i!=-1;i=edge[i].next)
    {   if(!DFN[edge[i].v]) {//如果没访问过
            tarjan(edge[i].v);//往下进行延伸,开始递归
            LOW[x]=min(LOW[x],LOW[edge[i].v]);
    //递归出来,比较谁是谁的儿子/父亲,就是树的对应关系,涉及到强连通分量子树最小根的事情。
        }
        else if(visit[edge[i].v ]){  //如果访问过,并且还在栈里。
            LOW[x]=min(LOW[x],DFN[edge[i].v]);
    //比较谁是谁的儿子/父亲。就是链接对应关系        
        }
    }
    if(LOW[x]==DFN[x]) //发现是整个强连通分量子树里的最小根。
    {
        do{
            printf("%d ",stack[index]);
            visit[stack[index]]=0;            
                  index--;
        }while(x!=stack[index+1]);//出栈,并且输出
        printf("\n");
    }
    return ;
}

int main()
{     memset(heads,-1,sizeof(heads));
    int n,m;
    scanf("%d%d",&n,&m);
    int x,y;
    for(int i=1;i<=m;i++)
    {
        scanf("%d%d",&x,&y);
        add(x,y);
    }
    for(int i=1;i<=n;i++)
        if(!DFN[i])  tarjan(i);
    //当这个点没有访问过,就从此点开始。防止图没走完
    return 0;
}

不知道你是否真的理解了Tarjan算法,

若还有疑问,欢迎在留言板处提问哦!

推荐阅读

  1. 普里姆(Prim)算法
  2. Java 机器学习库Smile实战(一)SVM

原文发布于微信公众号 - 机器学习算法全栈工程师(Jeemy110)

原文发表时间:2017-08-18

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏云霄雨霁

有向图----可达性问题

1580
来自专栏潇涧技术专栏

Python Algorithms - C9 Graphs

Python算法设计篇(9) Chapter 9: From A to B with Edsger and Friends

452
来自专栏Java成神之路

文本相似度——自己实现文本相似度算法(余弦定理)

最近由于工作项目,需要判断两个txt文本是否相似,于是开始在网上找资料研究,因为在程序中会把文本转换成String再做比较,所以最开始找到了这篇关于 距离编辑算...

813
来自专栏开发与安全

算法:图解最小生成树之克鲁斯卡尔(Kruskal)算法

我们在前面讲过的《克里姆算法》是以某个顶点为起点,逐步找各顶点上最小权值的边来构建最小生成树的。同样的思路,我们也可以直接就以边为目标去构建,因为权值为边上,直...

2128
来自专栏小樱的经验随笔

一步一步深入理解Dijkstra算法

先简单介绍一下最短路径: 最短路径是啥?就是一个带边值的图中从某一个顶点到另外一个顶点的最短路径。 官方定义:对于内网图而言,最短路径是指两顶点之间经过的边...

2583
来自专栏编程之旅

数据结构——最小生成树(C++和Java实现)

快要一整个月没有更新博客了,之前的几周每周都想着要写,但是最后时间还是排不开,最近的状态是一直在写代码,一直在怼工作的需求,顺便刷刷算法题,国庆则是没心没肺的玩...

814
来自专栏有趣的Python

算法与数据结构(七) 图论

图论 Graph Theory 图论并不是研究图画。而是研究由节点和边所构成的数学模型 ? 图论抽象模型 万事开头难,虽然看上去很复杂,但是慢慢学习深入之后会体...

3758
来自专栏Android机动车

数据结构学习笔记——总述

数据结构是一门研究非数值计算的程序设计问题中的操作对象,以及它们之间的关系和操作等相关问题的学科。

471
来自专栏雨过天晴

原 PHP 大数相加求和

1601
来自专栏七夜安全博客

从多项式相加看线性结构

963

扫描关注云+社区