字符串匹配算法c_字符串匹配算法c语言_字符串匹配朴素算法c语言 - 腾讯云开发者社区

、、、

我有很多字符串，其中包含许多不同拼写的文本。我通过搜索关键字来对这些字符串进行标记化，如果找到关键字，我会对该关键字使用关联文本。假设搜索字符串可以包含文本"schw.“、”schwa“。还有“施瓦茨”我有三个关键字，它们都可以解析为文本"schwarz“。现在，我正在寻找一种有效的方法来查找所有关键字，而不是为每个关键字执行string.Contains(关键字)。示例数据： H-Fuss ahorn 15 cm/SH48cm Metall-Fuss chrom 9 cm/SH42cm Metall-Kufe alufbg.12 cm/SH45c Metall-Kufe

浏览 2提问于2010-11-18得票数 9

回答已采纳

2回答

查找两个字符串之间的匹配百分比，同时考虑到单词- Python的顺序。

、、、

我正在寻找一种方法来输出两个字符串之间的匹配百分比(例如:名称)，同时也考虑到它们可能是相同的，但是单词的顺序不同。我尝试使用SequenceMatcher()，但结果只是部分令人满意： a = "john doe" b = "jon doe" c = "doe john" d = "jon d" e = 'john do' s = SequenceMatcher(None, a, b) s.ratio() 0.9333333333333333 s = SequenceMatcher(None, a, c) s

浏览 0提问于2018-10-31得票数 1

回答已采纳

3回答

最长公共子串的探讨

、、、、

在的编程挑战中，我采取了与一般最长的公共子串问题不同的方法。守则是 #include <cmath> #include <cstdio> #include <vector> #include<string> #include <iostream> #include <algorithm> using namespace std; void max(string a,string b,int n) { int count=0,x=-1,prev=0,i,j,k; for(i=0;i<n;i++)

浏览 4提问于2013-12-20得票数 2

回答已采纳

3回答

Perl模式的形式化语言表达

、、

经典正则表达式等价于有限自动机。目前大多数“正则表达式”的实现并不是严格意义上的正则表达式，而是更强大。一些人已经开始使用术语“模式”而不是“正则表达式”来更准确。可以用现代“正则表达式”(如Perl 5中支持的模式)描述的内容的正式语言分类是什么？更新:所谓“Perl5”，我指的是在Perl5中实现的模式匹配功能，并被许多其他语言(C#、JavaScript等)采用，而不是任何特定于Perl的功能。例如，我不想考虑在模式中嵌入Perl代码的技巧。

浏览 1提问于2009-12-07得票数 11

回答已采纳

1回答

缩短字符串中的重复序列

、、

我用VB.NET建立了一个博客平台，那里的读者非常年轻，出于某种原因，我喜欢在他们的评论中重复字符序列来表达他们的承诺。示例： Hi!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!！<3<3<3<3<3<3<3<3<3<3<3<3<3<3<3<3<3<3<3<3<3<3<3<3<3<3<3 ..and等等。我不想完全过滤掉它，但是，我想将它缩短到一行中最多5个重复的字符或序列。我

浏览 1提问于2010-06-30得票数 0

回答已采纳

1回答

apr-utils apr_strmatch正则表达式语法

、、

我想从python中移植以下正则表达式： HASH_REGEX = re.compile("([a-fA-F0-9]{32})") if HASH_REGEX.match(target): print "We have match" 使用apr-utils apr_strmatch函数转换为C： pattern = apr_strmatch_precompile(pool, "([a-fA-F0-9]{32})", 0); if (NULL != apr_strmatch(pattern, target, strlen(target))

浏览 0提问于2011-12-06得票数 1

回答已采纳

1回答

我拥有一个基因组字符串，如何有效地找到相同的部分

、

补充数据链：候选人： Bg_db：每个字串的长度是23，只要前面20个字行，因为数据太大，我只通过五分之一的1分，有快你可以粘贴的代码，让兄弟读吧，谢谢！以下是正式的问题：我现在有两个字符串数组，暂称为Candidates和Bg_db，它们都是长度为20的短字符串，每个字符串只包含以下四个字符串中的字符: A、T、C、G(右！是基因组序列！) Candidates = [ 'GGGAGCAGGCAAGGACTCTG', 'GCTCGGGCTTGTCCACAGGA', '...', # Be

浏览 3提问于2016-11-22得票数 0

3回答

在不带空格的长字符串中搜索重复(任何类型的重复)子字符串

我以前问过同样的问题，但没有得到我想要的。所以必须再发一次。我有一个很长的字符串，里面没有任何空格。现在，我尝试在这个长字符串中搜索重复的子字符串(任何类型，没有特定模式)。重复的长度可以是(min，max)之间的范围，即(min = 3，max = 5)。例如: String s= "atggucttuaccccggucttaacccc"；其中"gguctt“和"acccc”是两个不同的重复子字符串(在运行代码之前我不知道这一点)。因此，我在C#中徘徊，有没有什么快速的方法来确定重复以及重复发生的位置？提前谢谢。

浏览 0提问于2010-11-10得票数 0

回答已采纳

2回答

">“和"<”运算符如何用于字符串比较？

、

在我正在阅读的C++教科书( Bjarne使用C++编程、原理和实践)中，有许多代码片段的实例，其中字符串比较如下：if (str1 > str2)和一些代码。请有人向我解释一下“大于”和“小于”运算符是如何与声明如下的字符串一起工作的： #include <string> . . . string str1 = "foo"; string str2 = "bar"; 我已经尝试搜索Stack溢出和其他人来寻找这个答案，但是没有结果。

浏览 3提问于2020-06-07得票数 2

回答已采纳

1回答

KMP DFA前缀函数

、、、

我被要求学习KMP DFA，我在我的书中找到的是实现，但我们的讲师一直将某些东西称为“前缀函数”。我真的不能理解这个函数的哪一部分，有人能给我解释一下吗？如果有人问我这个问题，我很抱歉，但我找不到。 public class KMP { private String pat; private String t; private int[][] fsm; public static final int ALPHABET = 256; public KMP(String pat) { this.pat = pat; char[] pattern = pat.toCharArra

浏览 5提问于2013-11-24得票数 0

2回答

在visual C#中匹配字符串中的字符

我正在使用可视化的C#来计算单词错误率，我有一个文本框来表示正确的含义，一个文本框来表示错误的假设。为了计算WER，我需要计算:替换:已更改的单词，这是我的第一个问题插入:已插入句子中的单词已删除:已从原始句子中删除的单词对于EX：引用:这是一个NPL程序。假设:它是一个很酷的NPL。 it:替换是:正确的an :替换NPL:正确的程序:删除的酷:插入的我尝试了dasblinkenlight提出的算法(顺便说一句，非常感谢)，但有一个运行时错误，我无法解决它，行 int x= Compute(buffer[j], buffer_ref[i]); 索引超出了数组的界限。下面是我的代码

浏览 2提问于2012-12-08得票数 3

回答已采纳

3回答

字符串比较-C

、、

我正在尝试用C语言编写一个字符串例程，并且我一直在处理相同的问题。在C中，我有这样的字符串： MAMAAMAAALJ 如果我有这个字符串： AAA 如何确定AAA在MAMAAMAAAJ中？

浏览 1提问于2009-11-22得票数 1

回答已采纳

4回答

位置敏感的哈希实现？

、、、、

在C/C++/Java/C#中有没有相对容易理解(和容易实现)的位置敏感散列示例？我想了解更多关于这个概念的知识，所以我想在几个文本文件上尝试一个实现，看看它是如何工作的，所以我不需要任何高性能或任何东西……这只是一个哈希函数的例子，它为相似的输入返回类似的哈希值。之后我可以通过例子学到更多。:)

浏览 3提问于2011-04-24得票数 21

回答已采纳

1回答

如何使用elasticSearch有效匹配一个字符串中的成千上万个子字符串

我的问题很简单:我有一个包含40万个子字(电影和电视节目标题)的数据库。我想在一条信息中匹配这些标题，例如：我真的很喜欢游戏“权力的游戏”()和“西服”(Game)，而且聚光灯( Spotlight )也是一部很棒的电影。我需要的是匹配游戏的权力，适合和聚光灯在这串。我试图将所有标题发送到wit.ai，但它似乎无法处理100000个子字符串。我想知道elasticsearch是否能胜任这项工作？如果这是个常见的问题，对不起，你能帮我找到正确的方向吗？谢谢!

浏览 6提问于2016-10-26得票数 0

1回答

简化Regex匹配的复杂性

、、

我只是想知道这个正则表达式匹配问题的复杂性:给定一串小写字母和一个匹配规则，确定该规则是否与整个字符串匹配。该规则是一个简化的正则表达式，它只包含较小的字母和/或“。(期间)和/或“*”(星号)。句点可以与任何小写字母相匹配，其中星号可以匹配前一个元素中的零或多个。下面是一些示例： isMatch("aa"，"a")是假的 isMatch("aa"，"aa")是真的 isMatch("aaa"，"aa")是假的 isMatch("aa"，"a*")是

浏览 4提问于2013-03-03得票数 1

1回答

按特异性排序的通配符匹配列表

、

给定字符串列表，如下所示： a/b/*/lol/cats */* foo/bar/** foo/bar/*/C/** 您将如何根据特异性对它们进行排序？我的天真方法(适用于我的大多数测试用例)如下： var sorted = wildCards .OrderBy(c => c.HasCatchAll) .ThenBy(c => c.NumWildCards) .ThenByDescending(c => c.Pattern.Length); 在上面的代码中，HasCatchAll属性指示字符串的末尾有一个** (**的唯一有效位置)。我对上面的推理

浏览 0提问于2012-06-12得票数 3

1回答

字符串匹配性能: gcc对CPython

、、、、

在研究Python和C++之间的性能权衡时，我设计了一个小示例，主要集中在一个哑子字符串匹配上。下面是相关的C++： using std::string; std::vector<string> matches; std::copy_if(patterns.cbegin(), patterns.cend(), back_inserter(matches), [&fileContents] (const string &pattern) { return fileContents.find(pattern) != string::npos; } ); 以上都是

浏览 5提问于2015-03-15得票数 13

回答已采纳

1回答

Zlib Java与C之间的基准测试

、、、

我正试图通过切换到C来加快我的TIFF编码器的编写速度，并使用Z_SOLO定义的和最小的C文件集编译了Z_SOLO 1.2.8：adler32.c、crc32.c、deflate.c、trees.c和zutil.c。Java正在使用。我编写了一个简单的测试程序来评估压缩级别和速度方面的性能，并对以下事实感到困惑:考虑到更高级别所需要的时间的增加，压缩并不会有那么大的影响。我还惊讶于Java实际上在压缩和速度上都比Visual发行版编译(VC2010)表现得更好：爪哇： Level 1 : 8424865 => 6215200 (73,8%) in 247 cycles. Level

浏览 1提问于2014-07-24得票数 7

回答已采纳

2回答

KMP模式匹配算法背后的理论是什么？

、、、

KMP模式匹配算法的理论基础是什么？我理解算法本身，但是，不知道Knuth，Morris和Pratt是如何发明这个算法的。有没有什么数学证明？你能给我一个链接吗？

浏览 4提问于2011-12-10得票数 17

回答已采纳

2回答

从源和结果字符串中查找加密算法

、、

如果我们有一个源字符串和一个加密字符串，我们能找到用于加密该源字符串的算法/forumla吗？编辑这里有几个这样的字符串。字符串，加密字符串阿瓦塔戈里，c0e54a662e8d7adbf26e2515dcb2bfde Burris2120c9fe74ce3abb1507108dba1f04497e5 电话:96336189003e59a2d4a3fdbb2cf02707

浏览 1提问于2012-03-24得票数 1

回答已采纳

3回答

两个数组上的Diff函数，在c++/mfc/stl？

、、、、

Diff function on two arrays (or how to turn Old into New) Example One[]={2,3,4,5,6,7} Two[]={1,2,3,5,5,5,9} Example Result Diff: insert 1 into One[0], One[]={1,2,3,4,5,6,7} Diff: delete 4 from One[3], One[]={1,2,3,5,6,7} Diff: modify 6 into 5 in One[4], One[]={1,2,3,5,5,7} Diff: modify 7 into 5 i

浏览 1提问于2010-08-11得票数 1

3回答

在C中:读取输入字符串，在char数组中查找它

编写另一个程序时，它读取一个txt文件，并将所有字母字符和空格(如\0)存储在一个char数组中，而忽略其他所有内容。这部分起作用了。现在我需要它做的是读取用户输入的字符串，并在数组中搜索该字符串，然后在每次出现时打印该单词。我不擅长C的I/O，你如何读取一个字符串，然后在字符数组中找到它？

浏览 0提问于2011-01-28得票数 1

4回答

近似字符串匹配

、、、

我知道这个问题已经被问了很多次了。我想要一个关于哪种算法适合近似字符串匹配的建议。该应用程序仅专门用于公司名称匹配，而不适用于其他内容。最大的挑战可能是公司的最终名称部分和简短的命名部分示例: 1. companyA pty ltd. vs companyA pty。有限公司vs companyA 2. WES工程vs W.E.S.工程(极其罕见) 你认为Levenshtein编辑距离足够吗？我正在使用C# 向您致敬，Max

浏览 0提问于2010-11-18得票数 9

回答已采纳

1回答

如何使用边界矩形纠正OCR分割错误？

、、、

我将tesseract用于OCR，并注意到，有时会出现分割错误，“显然”属于一起的字符会被分割成单独的字符串。根据在一个文本行中发现的字符列表及其边界框，以及初步的OCR结果表明，这些字符中的哪些属于一个单词，我可以应用哪些算法来纠正分割错误或验证结果？所以这是可用的数据： List<Word> words; for(Word word : words){ for(Char c : word.getChars()){ char ch = c.getValue(); Rectangle rect = c.getRect(); } }

浏览 0提问于2012-04-18得票数 5

回答已采纳

5回答

确定两个字符串匹配概率的最佳实践

、、、

我需要编写代码，以确定当其中一个字符串可能包含与第二个字符串的小偏差时，两个字符串是否匹配。“南非”诉“南非”或“英格兰”诉“恩甘德”。目前，我正在考虑以下方法确定字符串1中与字符串2中字符匹配的字符百分比。通过将1的结果与两个字符串长度的比较来确定匹配的真实概率，例如，虽然"SA“中的所有字符都在”南非“中找到，但并不是很可能匹配，因为"SA”也可以在一系列其他国家的名称中找到。我希望听到执行这种字符串匹配的当前最佳实践是什么。

浏览 4提问于2010-02-22得票数 4

回答已采纳

1回答

最有效的字符串替换算法是什么？

、

KMP是用来搜索的，替换的是什么？

浏览 2提问于2009-12-15得票数 0

3回答

为什么朴素的字符串搜索算法更快？

、、

我正在测试这个网站上的字符串搜索算法：。测试文本是1个GByte大小的DNA碱基的随机序列。测试模式是随机大小(最大1kb)的随机序列的列表。测试系统为AMD Phenom II Windows955，GHz为3.2，内存为4 GB，Windows7为64位。代码用C编写，并使用带有-O3标志的MinGW编译。朴素搜索算法对于短模式需要4秒，对于1kB模式需要8秒。确定性有限状态机对于短模式需要2秒，对于1kB模式需要4秒。Boyer-Moore算法对于非常短的模式需要4秒，对于短模式大约需要1/2秒，对于1kB的模式大约需要2秒。其余算法的性能比朴素搜索算法差。如何才能使朴素搜索算法搜索

浏览 2提问于2013-11-16得票数 3

3回答

在较大矩阵中计数矩阵出现次数的算法

、、、

我现在面临一个问题，我需要计算某个MxM矩阵在NxN矩阵中出现的时间(这个应该比第一个要大)。对如何做到这一点有什么建议吗？我将在C中实现它，没有任何选项可以更改它。修订版1 大家好，我非常感谢大家对这件事的回答和意见。我应该告诉你们，经过几个小时的艰苦努力，我们找到了一个解决方案，它严格地不像Boyer方法，而是一个我自己的算法。我计划在测试和完成之后发布它。这些解决方案现在正被调整成并行化，以便使用C库MPI的大学集群进行速度优化。

浏览 2提问于2011-06-06得票数 11

回答已采纳

1回答

在c#中查找2个字符串中的通用子字符串

、

我有这样的字符串： 1) Cookie:ystat_tw_ss376223=9_16940400_234398; 2) Cookie:zynga_toolbar_fb_uid=1018132522 3) GET /2009/visuels/Metaboli_120x600_UK.gif HTTP/1.1 4) GET /2010/07/15/ipad-3hk-smv-price-hk/ HTTP/1.1 1个广告2有共同的替代{cookie：}3和4有共同的替代{GET /20，HTTP/1.1} 我想找到两个字符串(如1和2)之间长度超过3个字符(包含空格字符)的所有公共子字符串。我想用c

浏览 2提问于2015-05-27得票数 0

2回答

将变形字符串的列表与其正确值进行匹配

我有两个列表，每个列表包含50个名字。在两个列表之间存在满足以下条件的1-1对应关系:对于列表1中的每个姓名x，列表2中存在x的错误(或正确)拼写。如果我有列表1，而我得到的是拼写错误的列表2，是否有可靠的算法将拼写错误的名称与拼写正确的对应名称进行匹配？例如, 清单1:布什·奥巴马·特朗普列表2: Burts Pbame Tramp

浏览 20提问于2019-07-10得票数 1

4回答

在另一个字符串中查找数字字符串

、、

所以，我在C++上遇到了一个问题。我需要搜索一个五个数字的字符串，这些数字并不总是在一个字符串中的同一个位置。例如，有时源字符串可能是"sjdjfut93835sxx“，而其他时候则可能是"jj3333333335”。在第一个字符串中，我需要超出"93835“。在第二个字符串中，我不会提取任何内容，因为数字字符串超过五个字符。我需要找到的数字字符串是5个字符长，只有数字，没有字母在中间。做这件事最简单的方法是什么？我在这方面有很多麻烦，在谷歌或过去的StackOverflow问题上都找不到答案。谢谢!

浏览 7提问于2014-01-07得票数 2

回答已采纳

2回答

如何用匹配的单词打印grep结果？

、、

我有两份文件，“文件A"： Adygei Albanian Armenia_C Armenia_Caucasus Armenia_EBA Armenia_LBA Armenia_MBA Armenian.DG Austria_EN_HG_LBK Austria_EN_LBK 和"fileB"： HG01880.SG Aygei_o1.SG HG01988.SG Adygei_o2.SG HG02419.SG Albanian_o2.SG HG01879.SG Albanian.SG HG01882.SG Armenia_C.SG HG01883.SG Armenia_C

浏览 10提问于2022-02-09得票数 0

回答已采纳

3回答

如何实践实现数据结构和算法？

、、

我刚刚完成了使用Python和C学习数据结构和算法的基础知识，完成了我所读的书中的一些练习。我觉得有必要实现其中的一些数据结构和算法，以增强我对我刚刚学到的材料的理解，比如红黑树和优先级队列。有什么好的网站和材料供我在练习时使用吗？

浏览 0提问于2011-08-31得票数 4

回答已采纳

5回答

关于字符串算法的书籍

、

有许多关于字符串算法的帖子：，，然而，没有提到一般的文献。有人能推荐一本能深入探讨各种字符串算法的书吗？特别感兴趣的话题是近似字符串匹配，比如google提供的修正搜索字符串变体:)。非常感谢你的建议。

浏览 5提问于2010-05-11得票数 8

回答已采纳

2回答

具有模糊匹配能力的位置提取

、、

我用布宜诺斯艾利斯的街道列表作为语料库： av. de mayo av. del libertador av. diaz velez 一些投标位置字段包含以下文本： of. de compras hosp. c. durand (diaz velez 5044) c.a.b.a av. de mayo 525, planta baja, oficina 11, ciudad de buenos aires oficina de compras - av. diaz velez 5044 - cap. fed. - 我正在阅读这本书，因为它有一个我实现的“位置提取”部分。此代码的问题在于，语料

浏览 1提问于2014-07-08得票数 0

1回答

在MySQL列中搜索相似的单词

、

有没有办法防止MySQL区分b/w字符串，比如"Kill Bill: Vol 2“和"Kill Bill: Vol II"？我正在创建一个网络刮板，从不同的网站刮电影，并将它们存储在数据库中。由于不同的网站经常使用不同的标题，有没有办法忽略这些字符串中的细微差别？ Soundex听起来很有希望，但它对非英语字符串并不是那么有效。另一个例子："Padmaavat“和"Padmavat”。Soundex在这里可能是有效的，但我需要一个更可靠的解决方案。谢谢!

浏览 0提问于2018-04-06得票数 0

3回答

比较两个字符串以确定它们是否是旋转的

、、

旋转意味着一个字符串是通过将另一个字符串(一个或多个位)移动到右边创建的。例如abc和cab是旋转的，abcd和bacd不是旋转。我编写了下面的代码，但是它未能通过最后一个测试用例(不知道它是什么)。有人能给我一些关于哪里出了问题的提示吗?或者有没有更有效的算法： int isLetterInWord(char c, char* word)//find first letter in the word which is equal to c { int len = strlen(word); for(int i=0; i<len; ++i)

浏览 2提问于2014-11-03得票数 1

回答已采纳

2回答

建议替代方案的例程

、、

我的任务是提出一个例行程序，将建议替代域名注册，如果客户原来请求的域名已经注册。我认为第一步是将请求的域拆分为多个比特，这样我就可以找到替代方案来尝试。例如：mybigredtruck.com会被分解成“我的”、“大的”、“红色的”和“卡车”。然后我需要一些方法来解决这些问题。有没有人知道有什么方法、组件/ web服务可以完成这些功能。任何想法都会被广泛接受。

浏览 0提问于2010-07-02得票数 2

回答已采纳

2回答

我可以调优IndexOf选择吗？

、、、、

我对这个应用程序做了很长时间的性能分析。结果表明，大部分CPU都是由IndexOf函数使用的。这里的功能 public static string func_Fix_Google_Source(string srSource) { int irIndex = srSource.IndexOf("<div id=\"gt-form-c\">"); return srSource.Substring(irIndex); } 绳子的长度有关系吗？我相信我可能会缩短搜索字符串的长度。

浏览 6提问于2017-04-02得票数 0

回答已采纳

1回答

检查字符串是否包含另一个字符串算法？

、、、

如果我有字符串A和许多其他字符串，我想看看这些字符串中是否有任何其他字符串在A中。什么算法可以在尽可能少的迭代中做到这一点？例如： ‘你好，我叫Bob.’ 我想看看是否包含'name is b‘，它从11开始。我并不打算使用正则表达式库。谢谢

浏览 0提问于2012-06-05得票数 2

回答已采纳

1回答

如何匹配多行文本？

、、

string str = "hello world!\r\naa=`xxx_1`\r\nhello world!"; sregex rx = sregex::compile(".+=`(.+)_1`"); smatch what; if( regex_match( str, what, rx ) ) { std::cout << what[1] << '\n'; } 这样不行，我用的是boost.xpressive而不是boost.regex，怎么匹配多行文字？

浏览 21提问于2012-06-18得票数 3

1回答

Knuth-Morris-Pratt (KMP)和使用Ukkonen算法的后缀树在时间复杂度上的差异。

、、、、

是否有可能找到最长的公共子串，最长的回文子串，最长的重复子串，使用Ukkonen的算法同时使用KMP和后缀树搜索所有模式和子串检查？如果是，那么我应该使用哪一个算法，因为这两个算法都有线性时间复杂度？

浏览 19提问于2016-09-05得票数 1

1回答

Boost正则表达式在我的代码中不能按预期工作

、、

我今天才开始使用Boost::regex，而且我在正则表达式方面也是个新手。我一直在使用“调节器”和Expresso来测试我的正则表达式，似乎对我看到的内容很满意，但是将这个正则表达式转移到boost，似乎并没有完成我想要它做的事情。任何指点，以帮助我一个解决方案将是最受欢迎的。顺便提一个问题，有没有什么工具可以帮助我针对boost.regex测试我的正则表达式？ using namespace boost; using namespace std; vector<string> tokenizer::to_vector_int(const string s) { reg

浏览 1提问于2009-08-12得票数 3

回答已采纳

1回答

如果更改最大池大小，请重新启动Server？

、、

如果在连接字符串中更改“最大池大小”，是否需要重新启动Server以使更改生效？

浏览 1提问于2014-02-16得票数 0

回答已采纳

2回答

在KMP算法中，是否会出现文本轮错转移背后的推理？

、、

我一直在努力理解KMP算法。不过，我对kmp算法背后的推理还没有得到明确的理解。假设我的文本是bacbababaabcbab，模式是abababca。通过使用与sub(pattern)的适当后缀匹配的最长正确前缀的长度规则，我填充了sub(pattern)。 A、b、c、a 0 0 1 2 3 4 0 1 现在，我开始用我的模式和表在文本上应用KMP算法。在进入上述文本的索引4之后，我们通过按照KMP算法查看length(l)=5;来获得table[l-1]=3;的匹配，我们可以跳过长达2个字符的长度，并且可以继续。巴 abababca 在这一点上，我无法理解转换背后的逻

浏览 5提问于2013-09-14得票数 6

3回答

除了Knuth-Morris-Pratt，Rabin-Karp和likes of it之外，还有什么可用的字符串匹配算法？

、、、、

除了Knuth-Morris-Pratt，Rabin-Karp和likes of it之外，还有什么可用的字符串匹配算法？

浏览 5提问于2011-02-24得票数 3

1回答

是否有一种方法来检测文本的意义并判断其与另一文本的相似性？

、、

我正在从事一个android项目，在这个项目中，我需要判断/分级用户String条目，并将它们与“正确答案”(也就是String )进行比较。例如，如果我问一个问题：“圣诞节期间送给孩子们的礼物是什么，用来激发joy的心？”，并给出了“礼物”的答案。在这种情况下，我希望我的算法接受“礼物”、“圣诞礼物”、“圣诞礼物”……等等，作为正确的答案。当然，我可以创建一个数组，包含所有可能的答案，但这并不理想，尤其是在我处理较长的散文文本时。那么，问题is..are，有什么推荐的算法或库，我可以用在这里吗？如果没有，有什么好的选择呢？

浏览 5提问于2020-12-14得票数 1

回答已采纳

3回答

为什么regex在替换时会阻塞？

、

为什么这段C++代码会永远阻塞呢？ string word = " a\n"; regex indent("^( |\t)*"); word = regex_replace(word, indent, ""); 为什么这段C++代码会很快终止呢？ string word = " a\n"; regex indent("^( |\t)+"); word = regex_replace(word, indent, ""); 再加一句，为什么这件事会很快结束？ string word = " a\

浏览 5提问于2013-08-06得票数 3

回答已采纳

2回答

如果您有一个字符串字典，那么搜索文件和增加字符串出现次数的最快方法是什么？

、、、、

假设您有一个包含5个字符串的字典，并且您还有多个文件。我想遍历这些文件，看看字典中的字符串在这些文件中出现了多少次。我如何才能做到这一点，使它最有效率？我希望这可以扩展为超过5个字符串和超过几个文档的well..so。我对我使用的语言是相当开放的。最好是Java或C#，但同样，我可以用另一种语言工作。

浏览 1提问于2014-10-24得票数 0

2回答

在一个非常大的文本上搜索多个字符串

、、、、

我有大约200万个字符串，我需要在1TB文本数据中搜索每个字符串。搜索所有这些字符串并不是最好的解决方案，因此我正在考虑一种更好的方法来为所有字符串创建一个类似trie的数据结构。换句话说，是一个trie，其中每个节点都是一个单词。我想问，有什么好的算法、数据结构或库(在C++中)用于这个目的吗？让我来描述一下这个问题，伙计们，例如，我有这样的字符串: s1- -“我爱你”s2- -“你好吗？”s3- -“怎么了，伙计” 我有很多文本数据，比如t1-“嗨，我的名字是Omid，我喜欢电脑。你们好吗？”“你的每一个愿望都会实现，他们告诉我.”t3 t4 .。。t10000 然后，我想考虑每一

浏览 3提问于2014-02-18得票数 2