前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >AC自己主动机 总结

AC自己主动机 总结

作者头像
全栈程序员站长
发布2022-07-08 15:51:55
2990
发布2022-07-08 15:51:55
举报
文章被收录于专栏:全栈程序员必看

大家好,又见面了,我是全栈君

模板–参考六如家培训指南

代码语言:javascript
复制
/*===============================*\
依照训练指南写的
\*===============================*/
#include<cstring>
#include<queue>
#include<cstdio>
#include<map>
#include<string>
using namespace std;

const int SIGMA_SIZE = 26;
const int MAXNODE = 11000;
const int MAXS = 150 + 10;

map<string,int> ms;

struct AhoCorasickAutomata {
  int ch[MAXNODE][SIGMA_SIZE];
  int f[MAXNODE];    // fail函数
  int val[MAXNODE];  // 每一个字符串的结尾结点都有一个非0的val
  int last[MAXNODE]; // 输出链表的下一个结点
  int cnt[MAXS];
  int sz;

  void init() {
    sz = 1;
    memset(ch[0], 0, sizeof(ch[0]));
    memset(cnt, 0, sizeof(cnt));
    ms.clear();
  }
  inline void clear(){memset(cnt,0,sizeof(cnt));}//假设text不仅仅是一个的话,常常须要每次find都清空一次cnt数组
  // 字符c的编号
  inline int idx(char c) {
    return c-'a';
    //这里一定小心,假设没有给定字符范围的话。直接return c;
    //由于可能出现负的...病毒侵袭那题就是
  }

  // 插入字符串。v必须非0  void insert(char *s, int v) {    int u = 0, n = strlen(s);    for(int i = 0; i < n; i++) {      int c = idx(s[i]);      if(!ch[u][c]) {        memset(ch[sz], 0, sizeof(ch[sz]));        val[sz] = 0;        ch[u][c] = sz++;      }      u = ch[u][c];//u是下一个节点所存储的ch第一维的位置,相当于我trie中的nxt    }    val[u] = v;     //v是附加信息,最好区分开每一个单词这样     //cnt能够记录出现了哪些以及出现了几次     ms[string(s)] = v;  }  // 递归打印以结点j结尾的全部字符串  void print(int j) {    if(j) {      cnt[val[j]]++;//val[j]为单词的编号。ms存储了编号和单词的相应,能够用于打印单词      print(last[j]);    }  }  // 在T中找模板  int find(char* T) {    int n = strlen(T);    int j = 0; // 当前结点编号,初始为根结点    for(int i = 0; i < n; i++) { // 文本串当前指针      int c = idx(T[i]);      while(j && !ch[j][c]) j = f[j]; // 顺着细边走,直到能够匹配      j = ch[j][c];      if(val[j]) print(j);//到单词结尾      else if(last[j]) print(last[j]); // 找到了!    }  }  // 计算fail函数  void getFail() {    queue<int> q;    f[0] = 0;    // 初始化队列    for(int c = 0; c < SIGMA_SIZE; c++) {      int u = ch[0][c];      if(u) { f[u] = 0; q.push(u); last[u] = 0; }    }//由于第一个字符不匹配须要又一次匹配,    //所以第一个字符都指向root(root是Trie入口,没有实际含义)    //就是说全部单词第一个字符的f[]都等于0。把节点e的fail指针指向root表示没有匹配序列    // 按BFS顺序计算fail    while(!q.empty()) {      int r = q.front(); q.pop();      for(int c = 0; c < SIGMA_SIZE; c++) {        int u = ch[r][c];        if(!u) continue;        q.push(u);        int v = f[r];        while(v && !ch[v][c]) v = f[v];//ch[v][c]==0的时候,就是说没有继续能够匹配的字母边了。也是没法继续匹配了,所以继续沿失配函数走        f[u] = ch[v][c];        last[u] = val[f[u]] ? f[u] : last[f[u]];        //last[j] 节点j沿着适配指针往回走时,遇到的下一个单词结点编号        //last是为了解决找到一个单词之后,看看有没有其它串包括      }    }  }};AhoCorasickAutomata ac;

1、看一个范围内的字符,变化SIGMA_SIZE以及idx功能

版权声明:本文博客原创文章,博客,未经同意,不得转载。

发布者:全栈程序员栈长,转载请注明出处:https://javaforall.cn/117740.html原文链接:https://javaforall.cn

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2022年1月1,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档