腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
8
回答
Python中一个简单的
模糊
字符串
匹配
算法
是什么?
python
我想找出一种很好的
模糊
字符串
匹配
算法
。直接
匹配
对我不起作用-这不是太好,因为除非我的
字符串
100%相似,
匹配
失败。方法在
字符串
中工作得不太好,因为它在字符级别上工作。我在寻找类似于词级
匹配
的东西。这些应该
匹配
,因为
字符串
A中的所有单词都在
字符串
B中。 现在,这是一个过于简化的例子,但会有人知道一个好的,
模糊
的
字符串
匹配
<e
浏览 2
提问于2010-05-27
得票数 17
回答已采纳
3
回答
MySQL中的Damerau-Levenshtein距离
算法
mysql
、
algorithm
、
levenshtein-distance
有没有人知道Damerau-Levenshtein距离
算法
作为存储过程/函数的MySQL实现,它接受单个指定的
字符串
作为参数,并在特定表的特定字段中查找该
字符串
的
模糊
匹配
?我发现了各种过程/函数代码示例,它们比较两个指定的
字符串
并计算出距离,但首先,这只是Levenshtein距离
算法
,而不是Damerau-Levenshtein
算法
,其次,我不会比较两个
字符串
,而是在我选择的字段中找到与我指定的
字符串</
浏览 3
提问于2013-01-09
得票数 3
回答已采纳
1
回答
目录名
模糊
搜索的最佳
算法
algorithm
、
fuzzy-search
模糊
搜索目录名的最佳/适当
算法
是什么?我想要实现一个bash完成,它使用
模糊
搜索完成目录/文件名,但该
算法
似乎依赖于要
匹配
的
字符串
集。
浏览 3
提问于2013-12-09
得票数 3
回答已采纳
1
回答
克服Bitap
算法
的搜索模式长度
string
、
fuzzy-search
我是
字符串
近似
匹配
领域的新手。Bitap
算法
的提到了libbitap,据说它演示了该
算法
的无限模式长度实现,但我很难从它的源代码中获得这个想法。你有关于如何推广无限长度模式的Bitap的建议吗,或者关于另一个
算法
,可以在干草堆中建议的位置附近执行针的
模糊
字符串
匹配<
浏览 2
提问于2009-05-03
得票数 3
1
回答
用
模糊
匹配
算法
比较数据元素的最佳方法
levenshtein-distance
、
hamming-distance
、
fuzzy-comparison
我希望通过C#中记录链接的
模糊
匹配
算法
来比较两个数据元素或字段,并且我想确定哪一种
算法
最适合于每个比较。出生年份 我目前使用的近似
字符串
匹配
算法
例如,FirstName1 = "Bob"和FirstName2 = "Bob"将是完全
匹配
的,因此不会
浏览 3
提问于2016-05-16
得票数 2
1
回答
有没有比BK树更有效的
模糊
字符串
搜索方法?
string
、
algorithm
、
fuzzy-search
对于一个
算法
类,我正在做一个研究任何特定
算法
的项目。我选择调查。BK树与
模糊
字符串
搜索(例如拼写检查、单词推荐)相关联。然而,似乎BK树的执行速度并不快,甚至可能已经过时了。并没有太多好的学术资源。有没有更快、更有效的
模糊
字符串
匹配
算法
? 谢谢!
浏览 1
提问于2012-04-28
得票数 1
回答已采纳
2
回答
Lucene默认
模糊
匹配
实现的替代方案
lucene
、
string-matching
、
fuzzy
Lucene
模糊
匹配
使用一种基本的editDistance
算法
来实现
模糊
匹配
。对于Lucene,还有使用其他相似性度量的
模糊
匹配
的其他实现吗?他们也应该识别同音异义词。另外,请比较lucene的各种
模糊
匹配
方法。
浏览 0
提问于2010-05-18
得票数 1
1
回答
名称的近似
字符串
匹配
算法
string
、
algorithm
、
string-matching
、
fuzzy-comparison
、
approximate
我正在为下面的示例寻找
模糊
字符串
算法
:给定一个现有名称的数据库,如果
匹配
精度高于输入阈值(例如90%),则将输入
匹配
到最佳
匹配
名称,或者NA其他输入。JBondL->James BondBandJamesk->James Bond目前,像Levenstein这样的大多数
算法
和Soundex这样的基于语音的
算法
都无法
匹配
像
浏览 6
提问于2017-07-18
得票数 2
3
回答
lucene使用的
字符串
匹配
算法
java
、
algorithm
、
lucene
、
string-matching
我想知道Apache Lucene使用的
字符串
匹配
算法
。我一直在浏览lucene给出的所使用的索引文件格式。似乎lucene存储了文本中出现的所有单词以及它们在每个文档中出现的频率。但据我所知,为了有效地进行
字符串
匹配
,它需要对文档中出现的单词进行预处理。示例:搜索"iamrohitbanga is a user of stackoverflow“(使用
模糊
匹配
)为
浏览 1
提问于2010-02-06
得票数 4
回答已采纳
3
回答
使两个
字符串
匹配
,即使其中一个
字符串
包含拼写错误
ruby
、
regex
我得到了一个array_subscribed_players,并且我正在检查这个数组是否包含一个
字符串
:我正在寻找一种方法,即使我给出的
字符串
与array_subscribed_players中包含的
字符串
不完全
匹配
浏览 1
提问于2015-09-16
得票数 0
1
回答
匹配
允许单个交换的两个
字符串
java
、
string
、
levenshtein-distance
、
fuzzy-search
我正在运行一个
模糊
匹配
算法
,允许两个
字符串
通过Levenshtein度量有一个单独的差异。我怎样才能
匹配
这些差异呢?
浏览 4
提问于2017-07-03
得票数 1
回答已采纳
1
回答
模糊
匹配
数
algorithm
、
fuzzy-comparison
我一直在使用Double Metaphone和Caverphone2进行
字符串
比较,它们在名称、地址等方面工作得很好(Caverphone2最适合我)。所以我研究了和
算法
,它们基本上描述了我想要的东西,但并不完全是。它们似乎擅长验证,但似乎不是为
模糊
匹配
而构建的。有没有像Luhn和Verhoeff这样的东西,可以检测到单个数字的错误和涉及两个相邻数字的换位错误,用于编码和比较,类似于
模糊
字符串
算法
?我想对一个数字进行编码,然后将其与100,000个其他数字进行比较,以找
浏览 1
提问于2011-12-28
得票数 10
1
回答
R:如何在组合不同距离度量标准的同时找到最优的
字符串
匹配
?
r
、
text
、
character
、
string-matching
、
fuzzy-search
我有两个要合并的数据文件,它们都有关键字fund_name,但两个文件中的fund_name可能不同,可能其中一些行没有
匹配
项。因此,我想做一个
模糊
匹配
,为每一行返回最佳
匹配
。我看到在amatch()中有许多不同的method (即
字符串
距离度量),比如"osa","lv", "dl"……我想知道是否可以将它们组合在一起,只有当它们都找到相同的
匹配
项时才返回一个值。如果是这样,我应该如何编写
算法
? 在这种<em
浏览 1
提问于2018-07-10
得票数 0
8
回答
使用Levenshtein距离
匹配
的
匹配
百分比排名
distance
、
percentage
、
ranking
、
levenshtein-distance
我正在尝试使用Levenshtein距离
算法
将单个搜索词与可能
匹配
的字典进行
匹配
。该
算法
返回一个距离,表示为将搜索
字符串
转换为
匹配
字符串
所需的操作次数。由于搜索
字符串
可以比各个字典
字符串
更长或更短,那么用于将距离表示为百分比的适当逻辑是什么,这将定性地反映每个结果与查询
字符串
有多接近,其中100%表示精确
匹配
。PMi = (1 - Lev_distance(Q, Mi)/max(Strle
浏览 1
提问于2012-05-02
得票数 27
3
回答
用于名称
匹配
的
字符串
的相似性
string
、
algorithm
、
matching
、
string-matching
我正在尝试确定两个不同的餐厅名称是否相似,以便能够
匹配
它们。名称可能拼写错误,或者标题的各个部分顺序错误。我发现的一个比较难的例子是:"Mathias Dahlgren Matbaren“和"Restaurant Mathias Dahlgren” 我已经研究了几种不同的
模糊
字符串
差分
算法
,但没有找到适用于此用例的
算法
。有谁知道我可以使用的
算法</e
浏览 2
提问于2015-04-07
得票数 2
5
回答
“
模糊
匹配
”
字符串
的
算法
algorithm
、
search
、
string
、
fuzzy-search
我所说的
模糊
匹配
不是指Levenshtein距离或类似的东西,而是指它在TextMate/Ido/Icicles中使用的方式:给定一个
字符串
列表,查找那些包括搜索
字符串
中的所有字符,但可能包含其他字符的
字符串
,优先选择最佳
匹配
。
浏览 1
提问于2010-05-23
得票数 25
回答已采纳
1
回答
模糊
匹配
率
elasticsearch
、
elasticsearch-query
当我按如下方式查询
模糊
匹配
时,elasticsearch仍然只返回_score。但我期望的是基于
模糊
算法
的
匹配
百分比。我认为这是一个简单的可配置的东西,但我找不到任何它,因为它是常见的
模糊
匹配
的结果显示
匹配
百分比。 怎么可能做到呢?或者这并不是elasticsearch中常见的“实践”?但我在大多数用户界面中发现的
模糊
匹配
的
匹配
百分比得分。
浏览 1
提问于2019-10-14
得票数 0
2
回答
模糊
匹配
/分块
算法
algorithm
、
fuzzy-comparison
、
chunks
、
sliding-window
back to the beginning of the loop 这里的主要问题是声音
匹配
和指纹识别是
模糊
的和相对昂贵的操作
浏览 2
提问于2011-02-26
得票数 5
2
回答
最佳
模糊
匹配
算法
?
fuzzy-search
什么是最好的
模糊
匹配
算法
(
模糊
逻辑,N-Gram,Levenstein,Soundex……),能在更短的时间内处理超过100000条记录?
浏览 5
提问于2009-01-29
得票数 32
回答已采纳
1
回答
基于机器学习的数据
匹配
machine-learning
、
fuzzy-logic
我有大约4000客户记录和6000用户记录,约3000客户记录
匹配
,留下1000名不
匹配
的客户。我已经创建了一个使用Levenshtein和Hamming的
模糊
匹配
算法
,并为某些属性添加了权重,但我希望能够
匹配
剩余的记录,而不需要手工操作。理想情况下,我希望实现一种
算法
来获取客户和用户的
匹配
和输出
匹配
/不
匹配
。但是,难道我不需要用真正的负面来训练吗?是否有一种只需一个标签就能训练的
算法
?谢
浏览 0
提问于2018-03-30
得票数 6
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
模糊字符串匹配:FuzzyWuzzy
python实现字符串模糊匹配
算法字符串匹配-BF算法
算法 KMP字符串匹配
NLP教程:用Fuzzywuzzy进行字符串模糊匹配
热门
标签
更多标签
云服务器
即时通信 IM
ICP备案
对象存储
实时音视频
活动推荐
运营活动
广告
关闭
领券