腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
3
回答
如何计算
模糊
字符串
匹配
中的分数?
、
我想知道计算两个
字符串
之间
模糊
匹配
分数的数学逻辑和公式。 假设我有两个
字符串
s1和s2,我想在
python
中使用
模糊
匹配
。我知道像fuzzywuzzy这样的
python
库可以做到这一点。但我想知道
模糊
匹配
方法和比率计算背后的精确数学和逻辑。
浏览 2
提问于2020-10-17
得票数 0
回答已采纳
1
回答
怎样才能找到最好的
模糊
字符串
匹配
?
、
、
、
、
Python
的支持
模糊
字符串
匹配
。大声歌颂(现在)。 regex.search("(?
浏览 2
提问于2016-04-24
得票数 6
回答已采纳
6
回答
在
Python
中检查长
字符串
中存在的
模糊
/近似子
字符串
吗?
、
、
>>> import difflib0.8571428571428571#result = "manhatan","manhattin" an
浏览 5
提问于2013-07-19
得票数 68
回答已采纳
1
回答
如何成功地验证两个名字是相同的?
、
我已经完成了订单验证,在这里我验证了帐户名是否与账单名相
匹配
。你建议我怎么用
Python
做这样的事?
浏览 2
提问于2015-12-30
得票数 0
回答已采纳
3
回答
使用os.chdir访问文件夹以“\f”开头的文件
、
我想以下列方式访问我的文件夹:文件夹“
模糊
匹配
”以\f符号开始,该符号断开
字符串
。
浏览 5
提问于2017-05-24
得票数 0
回答已采纳
1
回答
参考表的
模糊
匹配
、
我正在尝试将非标准医疗诊断描述与ICD10参考表描述进行
匹配
,以获得ICD10代码。这将是
模糊
匹配
。例如,我在R中查看了stringdist包,以获得各种“
字符串
距离”度量,但效果参差不齐。我也在考虑词袋技术,但我不知道如何在我的情况下使用它。因为我比较的是小
字符串
而不是文本文档。
浏览 0
提问于2016-04-29
得票数 0
5
回答
更好的
模糊
匹配
性能?
、
、
、
、
我目前正在使用的方法get_close_matches方法来迭代15,000个
字符串
的列表,以获得与另一个大约15,000个
字符串
的列表最接近的
匹配
: a=['blah','pie','apple'..
浏览 2
提问于2014-01-28
得票数 4
1
回答
哪些
Python
库最适合
匹配
测试
字符串
、
、
、
哪些
Python
库最适合
匹配
测试
字符串
?我也有几百万行数据,其中地址有一个郊区字段,但这些都是以自由形式键入的。这意味着他们有拼写错误,以及各种奇怪的问题。(比如使用MT而不是Mount,以及数据输入操作员使用非标准约定之类的东西)我曾想过可能会给每个字母分配数字,然后尝试围绕kNN
匹配
构建一些函数,其他人建议以某种方式使用J
浏览 6
提问于2018-05-15
得票数 0
1
回答
从R到
Python
的
字符串
模糊
匹配
、
我试图在R和
Python
中使用
字符串
模糊
匹配
。我实际上使用了两个包:当我尝试R上的amatch("PARI", c("HELLO", "WORLD"), maxDist = 2)时,我得到的结果是但是,当我尝试使用
Python
:process.extract("PARI", ["HELLO", "WORLD"
浏览 4
提问于2021-07-06
得票数 1
1
回答
在
模糊
数据关联矩阵中查找“集线器”
、
、
、
如果我有一个
字符串
列表,我如何选择一些‘代表性’
字符串
,以便在它们之间,它们可以
模糊
地
匹配
列表中的所有
字符串
。第一步,对所有文本进行
模糊
匹配
,如下所示我的想法是选择两个或三个
字符串
,它们可以作为整个集合的代表,这样如果我
模糊
匹配
,我可以用>80的阈值将所有
字符串
标记为1。 有什么办法我能做到吗?
浏览 7
提问于2022-08-31
得票数 0
3
回答
如何在
Python
函数结果中发出“索引未找到”的信号
、
我正在编写一个小函数来返回
字符串
列表中
字符串
第一次出现的索引,使用“
模糊
”比较。显而易见的(只有?)要做的是返回-1。但是,由于
Python
中的-1意味着序列的最后一个元素,我觉得这可能不是一个好的
Python
风格。有没有更多的毕多尼(毕森克?)道路?
浏览 7
提问于2014-01-12
得票数 1
回答已采纳
1
回答
Golang中的
模糊
字符串
匹配
有没有进行
模糊
字符串
匹配
的go模块?如果我有一个
字符串
数组,我想检查给定的
字符串
是否与数组中的任何元素
模糊
匹配
。 请帮帮忙谢谢
浏览 2
提问于2014-01-08
得票数 15
1
回答
基于关键词的
模糊
匹配
、
、
有没有办法开发一个
模糊
匹配
逻辑(在
Python
语言或R语言中)来从df_1的df_2中查找ID
匹配
应基于
模糊
name
匹配
、精确city
匹配
、state
匹配
和zip
匹配
。如果在city_1中找不到
匹配
项,我会在city_2中查找
匹配
项。如果在state_1中找不到
匹配
项,我会在state_2中查找
匹配
项。df_2也是如此。如果我在NAME_1中找不到
模糊<
浏览 24
提问于2020-09-18
得票数 0
1
回答
基于R的
模糊
字符串
匹配
、
我有列x,它有
字符串
ABN-AMRO-NV/SUNTRUST-BK/WACHOVIA,列y有
字符串
SunTrust Banks。如您所见,列x有三个
字符串
,它们由正斜杠隔开。因此,在
模糊
匹配
之前,我必须使用strsplit拆分
字符串
。为了进行
模糊
匹配
,我尝试了一些软件包,如stringdist、adist、agrep等,但没有得到预期的好结果。那么,怎样才是解决我的
匹配
问题的好办法呢?如何处理这个
匹配</e
浏览 0
提问于2016-07-26
得票数 1
回答已采纳
1
回答
我应该使用哪些文本聚类算法来对
Python
中的空闲文本字段进行分组?
、
、
用
Python
做这件事最好的方法是什么?
浏览 0
提问于2015-12-21
得票数 2
1
回答
火花放电数据的
模糊
搜索
、
、
我想对其中一个列进行
模糊
搜索,并检索与输入
字符串
相似程度最高的记录。这个文件是由spark管理的,我通过pyspark将它加载到一些dataframe中。现在,我想使用像fuzzywuzzy这样的方法来提取与最佳
匹配
的行。
浏览 9
提问于2022-09-27
得票数 0
2
回答
如何在MySQL中
匹配
列
、
、
、
、
我相信这就是所谓的
模糊
匹配
?或者模式
匹配
?这是它的技术术语。 编辑:我知道Soundex和Levenstein disatance。这是你推荐的吗?
浏览 0
提问于2009-10-15
得票数 3
回答已采纳
1
回答
使用
Python
呼呼的
模糊
搜索(排名/得分直接命中高于
模糊
命中)
、
、
、
、
我在使用
模糊
查询时遇到了问题,与
Python
上的直接
匹配
相比,
模糊
查询与
模糊
命中术语的相关性更高。库中是否有可用的现有选项来获得更高的直接
匹配
分数?或者我必须对其进行单独编码(i.e.do直接查询和
模糊
查询,并将文本排序更高...)?谢谢你的建议。
浏览 8
提问于2020-12-13
得票数 0
1
回答
弹性搜索match_phrase +
模糊
性
、
我正在使用ElasticSearch,我试图实现match_ cases /string+
模糊
性,但这似乎是不可能的(在线示例不多,文档中没有这样的例子)。我需要的是:短语/
字符串
匹配
+
模糊
+斜率,基于字段的每个值。query_string -它有
模糊
性和斜率包括在内。但是,它通过一个文档收集字段的所有值中的
字符串
。 match_phrase --它包含了斜率,但是没有
模糊
性。什么是好的-
浏览 2
提问于2018-12-06
得票数 6
回答已采纳
2
回答
如何降低在
Python
中比较多个
字符串
的处理成本?
、
、
我有两个数据集,A和B,它们包含一个类似于标题的
字符串
变量。这两个数据集都很大(数百万次观测)。在进行比较之前,也许可以先对数据集进行一些智能索引?欢迎任何想法/建议。重要问题:
匹配
应该是
模糊
的,因为我可以有以下标题他们不完全
匹配
,但他们真的很接近。如果
浏览 2
提问于2016-01-07
得票数 1
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
python实现字符串模糊匹配
模糊字符串匹配:FuzzyWuzzy
NLP教程:用Fuzzywuzzy进行字符串模糊匹配
Excel 实用 tips 9:如何模糊匹配不连续的字符串?
Python字符串开头或末尾匹配
热门
标签
更多标签
云服务器
ICP备案
实时音视频
即时通信 IM
对象存储
活动推荐
运营活动
广告
关闭
领券