首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    字符匹配(一) -- 朴素匹配与 KMP 算法

    引言 软件算法中,最基础的算法要数排序和查找了,而字符串模式匹配算法可谓是基础中的基础,而最有名又最具代表性的字符匹配算法要数 KMP 算法了,本文我们就来详细介绍一下 KMP 算法 2....朴素匹配算法 最简单的算法就是朴素匹配算法了,所谓的“朴素匹配算法”指的就是人们常说的“暴力匹配算法”。...KMP 算法 如果模式串为 ABCDE,我们通过上述的朴素字符匹配算法与原字符串 ABCDFABCDE 进行匹配,假设经比较原字符串开始处的 ABCD 已经与模式串匹配,而 E 却不匹配,按照朴素匹配算法...是因为已匹配部分的字符串没有重复字符,如果已匹配字符串拥有重复字符,情况又会变得不一样。...时间复杂度 按照上述算法,如果某个字符匹配成功,模式串首字符的位置保持不动,仅仅是i++、j++;如果匹配失配,i 不变(即 i 不回溯),模式串会跳过匹配过的next [j]个字符

    1.3K20

    字符匹配---BF算法--朴素的模式匹配算法

    namespace std; #include //BF int BF(string& a,string& b) { //求出a串的长度 int sizeA=a.length();//返回的是字符串中字符个数...//往后移动一次,相当于加1 i = i - j + 1; //j回到子串头部 j = 0; } } //i的值是按下标从0开始本身应该是8,j的值本身应该是4,但最后一次匹配成功后...,还有一次i++和j++ cout << "循环结束后i=" << i << endl; cout << "循环结束后j=" << j << endl; //判断是<em>匹配</em>成功还是<em>匹配</em>失败 if (...j == sizeB) { //退出循环时i记录的是自串的最后一个<em>字符</em>在主串中的位置加一 //j记录的是子串的最后一个元素的位置加一,等于子串的长度 //i-j得到的是子串的第一个<em>字符</em>在主串中的位置...return i-j;//<em>匹配</em>成功,返回子串在主串中的起始位置 } else { return -1; } } //测试代码-------------- void test() {

    2.1K20

    【数据结构】数组和字符串(十四):字符匹配1:朴素的模式匹配算法(StringMatching)

    字符匹配可以采用多种算法,包括朴素模式匹配算法、KMP(Knuth-Morris-Pratt)算法、Boyer-Moore算法等。...于是再从 S 的字符 S_{1} 开始进行第二次匹配,重复刚才的步骤 看是否有 S_{1}=P_{0},S_{2}=P_{1},…,S_{m}=P_{m-1} 若匹配成功,返回与P0相匹配字符...否则从S的字符S2开始进行第三次匹配’ …… 若第 n-m+1 次匹配(即最后一次匹配)仍得不到 S_{n-m}=P_{0},S_{n-m+1}=P_{1},…,S_{n-1}=P_{m-1} ,说明匹配失败...这种模式匹配算法被称为朴素的模式匹配算法, 2. ADL语言 3....return 0; } 5 时间复杂度   朴素模式匹配算法的优点是过程简单,缺点是效率低。

    10210

    串的朴素模式匹配算法

    串的朴素模式匹配算法 早就听闻串的KMP算法狠难搞,让我没想到的是,还没到KMP呢,在朴素模式匹配算法就让我猛喝了一壶,那么,今天就一起来看一看。 算法思路 思路其实很简单,在上一节也提到过。...首先我们先明确几个概念: 主串:就是一个串,任何一个串都可以设为主串 子串:主串中连续字符组成的子序列,一定是主串中存在的才叫子串 模式串:想尝试在主串中找的串 那么朴素模式匹配算法的思路就是:设模式串的长度为...我们设置了两个整数变量,借助两个变量来一个字符一个字符比。 这里还是举个栗子吧。...=T[i],说明此子串与模式串匹配失败,于是下一个子串和模式串匹配,此时j的值变为1即可,问题是:如何把i的值变为下一个子串的第一个字符呢?...在正常情况下,若能匹配成功,j最后指向的位置应是T.length + 1,因为在最后一次循环执行了j++操作,也就是说,只有j>T.length时,才表明模式串的所有字符都和某一子串完全匹配,而若 j

    55530

    字符匹配算法_多字符匹配

    BM(Boyer-Moore)算法 思想:有模式串中不存在的字符,那么肯定不匹配,往后多移动几位,提高效率 BM原理:坏字符规则,好后缀规则 1.1 坏字符规则 利用坏字符规则,BM算法在最好情况下的时间复杂度非常低...每次比对,模式串都可以直接后移四位,所以,匹配具有类似特点的模式串和主串的时候,BM算法非常高效。 单纯使用坏字符规则还是不够的。...= b[j]) break; //坏字符对应模式串中的下标是j } if(j < 0) //匹配成功 {...如果处理字符集很大的字符匹配问题,badchar数组对内存的消耗就会比较多。...---- BM算法核心思想是,利用模式串本身的特点,在模式串中某个字符与主串不能匹配的时候,将模式串往后多滑动几位,以此来减少不必要的字符比较,提高匹配的效率。

    1.8K20

    Java字符匹配_正则匹配替换字符

    Java的java.util.regex包 按照面向对象的思路,把希望查询的字符串如is、thing或ting封装成一个对象,以这个对象作为模板去匹配一段文字,就更加自然了。...1、写一个特殊的字符串——正则表达式如a|f。 2、将正则表达式编译成一个模板:p 3、用模板p去匹配字符串str。...我们使用正则表达式,用于字符串查找、匹配、指定字符串替换、字符串分割等等目的。...所以,*表示前面字符可以有零次或多次。如果仅仅考虑查找,直接用”a”也一样。但想想替换的情况。 问题regEx=”abb*”结果如何? ②”ab+”——能匹配ab、abb、abbb……。...——能匹配o和or。?表示前面字符可以有零次或一次。 这些限定符*、+、?

    2.6K20

    字符串的匹配算法_多字符匹配

    文章目录 BF算法 RK算法 编辑器中的全局替换方法:BM算法 坏字符 好后缀规则 代码实现 KMP算法 一说到字符匹配算法,不知道会有多少小伙伴不由自主的想起那个kmp算法呢?...我们假设要匹配字符串的字符集中只包含 K 个字符,我们可以用一个 K 进制数来表示一个子串,这个 K 进制数转化成十进制数,作为子串的哈希值。...坏字符 BM 算法的匹配顺序比较特别,它是按照模式串下标从大到小的顺序,倒着匹配的。 我们从模式串的末尾往前倒着匹配,当我们发现某个字符没法匹配的时候。...我们把这个没有匹配字符叫作坏字符(主串中的字符) 这时候该如何操作呢?我们去子串中寻找这个坏字符,如果找到了,就让两个字符的位置对上,继续往后,如果没有找到,就将整个子串移动到坏字符后面。...= b[j]) break; // 坏字符对应模式串中的下标是 j } if (j < 0) { return i; // 匹配成功,返回主串与模式串第一个匹配字符的位置

    2.2K20

    字符匹配之蛮力匹配

    我们需要做的就是回答这个匹配串是否出现在文本串中。 概述 字符串蛮力匹配法的原理非常简单。我们必须检查匹配串的第一个字符与文本串的第一个字符是否相匹配,就如下图片所述。...我们通过比较文本串的和匹配串的第一个字符来开始 如果他们不匹配我们移向文本串的第二个字符。现在我们比较匹配串的第一个字符和文本串第二个字符。...如果他们不匹配我们继续向前移动,直到我们遇到一个相匹配的或直到我们到达文本串的最后。 因为文本串第一个字符匹配串的第一个字符匹配,我们向前移动到文本串的的第二个字符。...现在我们比较文本串的第二个字符匹配串的第一个字符! 假设第一个字符匹配,我们移向匹配串的第二个字符去和文本串的下一个字符比较。如下面图片所示。...如果文本串的一个字符匹配串的第一个字符匹配,我们向前移动到匹配串第二个字符和文本串的下一个字符匹配 如果仅仅是因为匹配串的第一个字符与文本串的某个字符匹配,那并不意味着这个匹配串出现在文本串中,

    1.6K10

    字符匹配

    问题描述 试题编号: 201409-3 试题名称: 字符匹配 时间限制: 1.0s 内存限制: 256.0MB 问题描述: 问题描述   给出一个字符串和多行文字,在这些文字中找到字符串出现的那些行...你的程序还需支持大小写敏感选项:当选项打开时,表示同一个字母的大写和小写看作不同的字符;当选项关闭时,表示同一个字母的大写和小写看作相同的字符。...接下来n行,每行包含一个字符串,字符串由大小写英文字母组成,不含空格和其他字符。 输出格式   输出多行,每行包含一个字符串,按出现的顺序依次给出那些包含了字符串S的行。...如果将输入的第二行改为0,则第四个字符串应该输出。 评测用例规模与约定   1<=n<=100,每个字符串的长度不超过100。...package geekfly.test; import java.util.Scanner; public class 字符匹配 { public static void main(String

    82010

    字符匹配算法_字符串模式匹配算法

    ,对信息的搜寻至关重要,因此子字符串查找(即字符匹配)是使用频率非常高的操作:给定一段长度为N的文本和长度为M的模式字符串(N≥M),在文本中找到一个和模式串相匹配的子串。...,已匹配字符串长度就是状态,而当前状态的转换则由下一个字符来决定。...以下图为例: ababac在第6个字符匹配时,我们已经知道前5个字符“ababa”的信息。...(2)如果造成匹配失败的文本串字符包含在模式串中,则找到这个字符在模式串中最靠右的位置,对齐模式串和文本串,使得该字符和它在模式串中出现的最右位置相匹配。...总结 上述几种字符匹配算法都各有特点,且在工业生产中都着应用。

    2.8K20

    【数据结构】详细介绍串的简单模式匹配——朴素模式匹配算法

    匹配我们可以理解为配对,对于字符而言,能够凑成一对的只有相同的字符,因此字符匹配就是寻找相同的字符。而模式匹配我们可以理解为有一个固定的模版,我们要寻找与模板相同的内容。...在字符串中,模式匹配指的就是给定一个字符串,然后在另一个字符串中寻找与这个字符串相同的字符串。...今天我们要介绍的就是模式匹配算法中最简单也是最直接的朴素模式匹配算法。下面我们就来谈谈如何实现朴素模式匹配算法。...我们只需要在主串中一个字符一个字符的与模式串的各个元素进行匹配匹配相同数量就行,如下所示: 相信大家现在应该就能明白朴素模式匹配算法的底层逻辑了,接下来我们就需要探讨一下如何实现朴素模式匹配算法了;...对于朴素模式匹配的参数类型,我选择的是主串以定长顺序存储类型,模式串以字符指针的类型来实现,因此函数声明的代码如下所示: //朴素模式匹配算法 int Index(SString S, char* T)

    8010

    字符串 模式匹配

    要点 模式匹配是数据结构中字符串的一种基本运算,给定一个子串,要求在某个字符串中找出与该子串相同的所有子串,这就是模式匹配。...假设P是给定的子串,T是待查找的字符串,要求从T中找出与P相同的所有子串,这个问题成为模式匹配问题。P称为模式,T称为目标。...算法思想 BF算法的算法思想是: 从目标串T的的第一个字符起与模式串P的第一个字符比较。 若相等,则继续对字符进行后续的比较;否则目标串从第二个字符起与模式串的第一个字符重新比较。...直至模式串中的每个字符依次和目标串中的一个连续的字符序列相等为止,此时称为匹配成功,否则匹配失败。 通过下图示例,可一目了然: ? 算法性能 假设模式串的长度是m,目标串的长度是n。...为了确定匹配不成功时,下次匹配时 j的位置,引入了next[]数组,next[j]的值表示模式串P[0...j-1]中最长后缀的长度等于相同字符序列的前缀。 这个next 数组叫做部分匹配表。

    1.4K80

    一文帮你搞懂 | 串的模式匹配-朴素匹配和KMP算法及优化

    目录 朴素模式匹配算法 KMP算法  求模式串的next数组 总结:求模式串的next数组 KMP算法优化 ---- 本篇文章参考王道数据结构内容,详细引导KMP算法的内容 ,建议先看一下字符串的存储结构...(1条消息) 串的存储结构 --王道_莫浅子的博客-CSDN博客 朴素模式匹配算法 什么是模式匹配 串的模式匹配就是在子串中找到与模式串相同的子串,并返回其所在位置。...朴素算法算法性能分析: 若模式串长度为m,主串长度为n,则 匹配成功的最好时间复杂度:O(m) 匹配失败的最好时间复杂度:O(n-m+1)=)(n-m)约等于O(n)  如果出现一下情况 ... 当 i = 7匹配失败的时候 ,让 j 指向 j = 5 的位置,所以它的next[7] = 5 在看这个例子  当 j = 5 匹配失败的时候,把字符往右移一格  同样的也可以匹配到,我们让next...串的后缀:包含最后一个字符,且不包含第一个字符的子串. 当第 j 个字符匹配失败,由前 1 --  j - 1个字符组成的串记为S,则:next [j] = S的最长相等的前后缀长度+ 1 。

    58320

    【CCF】字符匹配

    本文链接:https://blog.csdn.net/weixin_42449444/article/details/100601434 试题编号: 201409-3 试题名称: 字符匹配 时间限制...: 1.0s 内存限制: 256.0MB 问题描述: 问题描述   给出一个字符串和多行文字,在这些文字中找到字符串出现的那些行。...你的程序还需支持大小写敏感选项:当选项打开时,表示同一个字母的大写和小写看作不同的字符;当选项关闭时,表示同一个字母的大写和小写看作相同的字符。...接下来n行,每行包含一个字符串,字符串由大小写英文字母组成,不含空格和其他字符。 输出格式   输出多行,每行包含一个字符串,按出现的顺序依次给出那些包含了字符串S的行。...如果将输入的第二行改为0,则第四个字符串应该输出。 评测用例规模与约定   1<=n<=100,每个字符串的长度不超过100。

    98520

    KMP字符匹配

    假设我们有这样一个要求,一个字符串S,一个匹配字符串P,我们想知道匹配串P是否被包含在字符串S中,如果包含那它在S的什么位置上?...字符串S: DABABCABABCABDB 匹配串P: ABCABD 匹配过程,如表格所示: 可见匹配过程中,字符串S的指针会不仅会右移,还会左7移,如第3次匹配过程; 整体匹配次数大致是n*m...A与D匹配失败,A对应next[0]值为-1,匹配串P整体后移一位,重新与字符串S匹配. 2....匹配成功 总结一下,通过辅助数组next[],确定整体匹配过程中,匹配串P的某个元素该与字符串S匹配,避免字符串S的指针回溯; 利用辅助数组next[],确定匹配失败时,后续匹配串该如何移动和重新比较,...= -1,且当前字符匹配失败(即S[i] !

    84820
    领券