腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
1
回答
将
字符串
替
换为
最
频繁
的
模糊
匹配
r
、
stringdist
我有一个非结构化名称
的
数据帧,我想在一列中创建一个清理名称
的
'master‘列表,在另一列中创建所有变体。我正在使用stringdist包。|dot | 0.0000000| 12|您可以看到,在clean列中,有两个条目分别对应于"dog“和"dogg",我希望
将
这两个条目折叠为一个条目(dog),因为
字符串
"dog”出现得更
频繁
。| |dog |dogy | 0.083333
浏览 8
提问于2020-02-06
得票数 2
回答已采纳
2
回答
SQL -确定列中出现频率最高
的
单词
sql-server
、
tsql
、
vba
、
frequency-analysis
有没有一种简单
的
方法可以使用T-SQL或VBA确定列/字段中出现频率最高
的
单词? 我正在为两个给定
的
记录集开发一个
模糊
匹配
系统,并希望在
最
频繁
出现
的
单词被删除
的
情况下生成一个
匹配
字符串
。由于数据来自客户关系管理数据库,因此
将
删除"limited“、"ltd”、"plc“和”customer“等术语。
浏览 2
提问于2011-12-01
得票数 4
回答已采纳
1
回答
基于
最
频繁
字符计数
的
Java
字符串
操作
java
、
string
、
algorithm
、
data-structures
在最近
的
采访中,我被要求为下面的
字符串
操作程序找到解决方案。给出
字符串
s,用1表示
最
频繁
的
字符,以01表示第二
最
频繁
的
字符,用001表示第三大字符等等。如果
字符串
是"marrymyyyr",那么输出应该是: 每个字符
的
查数为m:2,a:1,r:3,y:4最高计数数为4,因此,使用该计数
的
字符应打印1代
替
该字符,以计数3
的
字符作
浏览 0
提问于2016-02-05
得票数 0
回答已采纳
6
回答
PHP:查找出现在
字符串
或数组中
的
最
频繁
的
单词
php
、
string
、
function
我知道我可以用这种方法在数组中找到最常见
的
元素:$array = array('good', 'good', 'good', 'cool'); $array = array_keys($array);如果我想找出
最
频繁
的
单词而不是
最
频繁
的
浏览 4
提问于2012-04-02
得票数 2
回答已采纳
2
回答
字符串
中
的
模糊
模式搜索:d-不
匹配
的
最
频繁
模式
python
、
bioinformatics
我希望找到所有1)
字符串
中最
频繁
的
模式,2)最多有d个不
匹配
的
模式。 对于这个给定
的
任务,我实现了一个函数,该函数计算给定模式在具有d不
匹配
的
字符串
中出现
的
次数。该算法
的
思想是基于使用
字符串
子模式
的
位掩码和给定模式
的
位掩码
的
卷积。它会产生正确
的
结果。number_of_occurances_with_at_mo
浏览 0
提问于2013-11-05
得票数 2
4
回答
带项权值
的
模糊
字符串
匹配
python
、
string
、
information-retrieval
我正在开发一个应用程序,它试图
将
一组潜在“混乱”
的
实体名称与参考列表中
的
“干净”实体名称相
匹配
。我一直在使用编辑距离和其他常见
的
模糊
匹配
算法,但我想知道是否有更好
的
方法允许术语加权,比如在
模糊
匹配
中赋予公共项较少
的
权重。 考虑这个例子,使用Python
的
difflib库。,所以这两个示例在完整
字符串
上
的
得分都很高。我正在寻找关于如何
将</
浏览 6
提问于2012-10-06
得票数 16
1
回答
PySpark
将
较少
频繁
的
项替
换为
最
频繁
的
项
apache-spark
、
pyspark
、
apache-spark-sql
、
spark-dataframe
、
apache-spark-mllib
我在一个数据框架中有一个分类栏,其中包含一些级别,现在我想用
最
频繁
的
级别替换那些频率较低
的
级别(其频率在总数中所占
的
百分比低于某一特定百分比)。我怎样才能以一种优雅而紧凑
的
方式意识到这一点?下面是一个例子,如果我
将
指定
的
频率设置为0.3,那么级别"c“应该替
换为
"a”,因为它
的
频率只有1/6,低于0.3。
浏览 3
提问于2017-11-09
得票数 3
回答已采纳
4
回答
使PHPStorm中
的
“到处搜索”类似于Sublime Text 3
的
"Goto Anything“
intellij-idea
、
phpstorm
、
sublimetext3
我正在从ST3转换过来,我想复制我在ST3中经常使用
的
一个搜索行为。 如您所见,ST3使用
模糊
字符串
匹配
来
匹配
项目中
的
任何路径和文件名。ze vi help
将
匹配
在其文件路径中包含该字符顺序列表
的
任何文件。
浏览 2
提问于2015-04-22
得票数 13
1
回答
RegEx -
将
字符串
从字符91提取到字符180,并删除前后
的
所有内容。
regex
输出将如下所示: 所以现在我需要删除91号字符之前
的
所有内容
浏览 3
提问于2020-03-18
得票数 1
回答已采纳
3
回答
Node.js或C
的
不区分大小写、精确
的
子
字符串
匹配
/索引(不进行全文搜索)
c
、
node.js
、
search
、
indexing
、
full-text-search
哪些库提供不区分大小写
的
、精确
的
子
字符串
匹配
,在Node.js中与大量
字符串
进行
匹配
?我正在特别寻找基于索引
的
解决方案。按照顺序,我并不是在寻找带有词干和停止词
的
模糊
、智能、全文搜索;相反,
最
简单(也是最快速)
的
子
字符串
匹配
器与一个大规模
的
索引
匹配
器。解决方案在JavaScript中是受欢迎
的
,C中
的<
浏览 5
提问于2015-02-05
得票数 1
2
回答
最适合基于前缀
的
搜索
的
数据结构
c
、
regex
、
algorithm
、
data-structures
、
hash
我必须在内存中维护键值对
的
数据结构。我有以下限制: 键和值都是长度分别为256和1024
的
文本
字符串
。任何键通常看起来像k1k2k3k4k5,每个k(i)本身都是4-8字节
的
字符串
。operations:Add DS
将
具有以下void del_kv(void *ds, char *key);LookUp不
频繁
操作:典型签名看起来像void add_kv(void *ds, char*lookup(void *ds, char *key);Iterate
最</em
浏览 39
提问于2018-06-04
得票数 3
1
回答
在特定
字符串
之后不
匹配
字符串
的
Regex。
javascript
、
regex
、
string
我需要在特定
字符串
之后不
匹配
字符串
的
正则表达式,假设我有以下
字符串
在上面的
字符串
中,我必须将所有的5s替
换为
0,直到8之后
的
5s除外,如下所示:我尝试了如下: "4515856581128483548598852649285965
浏览 0
提问于2017-11-08
得票数 3
回答已采纳
1
回答
WEKA训练用例和测试用例不
匹配
string
、
testing
、
match
、
weka
我
的
例子是很长
的
文本。我想使用一个特征集,其中第i个元素是第i个
最
频繁
的
单词,例如,第一个特征是
最
频繁
的
单词。 我
的
问题是,如果我使用
字符串
功能,那么我就不能使用我想要
的
分类器。如果我使用名义特征,我会将第一个特征作为我
的
训练示例中最常用
的
单词。对于测试示例,第一个特征是我
的
测试示例中出现频率最高
的
单词。所以这些特征是不同<em
浏览 3
提问于2013-08-12
得票数 0
3
回答
Seaborn Countplot :仅显示n个最常用
的
类别
python
、
seaborn
我有一个python数组,列出了
字符串
标签
的
所有
匹配
项。让我们称它为labels_array。使用seaborn作为sns我想要显示此数组
的
计数图: sns.countplot(labels_array)这样行得通,但是由于我
的
数组中有太多不同
的
标签,所以输出结果看起来不太好。有没有办法只显示n个
最
频繁
的
标签。
浏览 7
提问于2017-11-21
得票数 0
3
回答
使用os.chdir访问文件夹以“\f”开头
的
文件
python
、
string
我想以下列方式访问我
的
文件夹:文件夹“
模糊
匹配
”以\f符号开始,该符号断开
字符串
。绕开这些符号
的
最
简单
的
方法是什么?
浏览 5
提问于2017-05-24
得票数 0
回答已采纳
2
回答
Elasticsearch:搜索
最
频繁
的
比赛/术语,而不需要TF或国防军调整
elasticsearch
它基本上是一个bool查询,在许多不同
的
字段上混合了“术语”和“
匹配
”(使用
模糊
度、ngram、边ngram等)。由于我们希望将不同
的
查询类型与"bool“组合在一起,所以在”交叉字段“查询方面尝试了我们
的
最佳运气。输入"astr“
将<
浏览 4
提问于2015-09-20
得票数 2
1
回答
为什么在执行
模糊
搜索时会绕过Solr过滤器禁用?
lucene
、
solr
我
的
Solr设置包含用于索引和查询
的
过滤器LowerCaseFilterFactory,因此barba找到Barba和BARBABarba找到Barba和BARBA Barba我对这些结果
的
解释是:当执行
模糊
搜索时,查询不再是小写
的
(所以已经
浏览 1
提问于2010-03-04
得票数 3
回答已采纳
1
回答
在
模糊
数据关联矩阵中查找“集线器”
python
、
adjacency-matrix
、
fuzzywuzzy
、
fuzzy-comparison
如果我有一个
字符串
列表,我如何选择一些‘代表性’
字符串
,以便在它们之间,它们可以
模糊
地
匹配
列表中
的
所有
字符串
。第一步,对所有文本进行
模糊
匹配
,如下所示我
的
想法是选择两个或三个
字符串
,它们可以作为整个集合
的
代表,这样如果我
模糊
匹配
,我可以用>80
的
阈值
将
所有
字符串
标记为1。 有什么办法我能做到吗
浏览 7
提问于2022-08-31
得票数 0
1
回答
基于函数中
的
值计数创建虚拟变量
python
、
pandas
、
dataframe
、
function
、
dummy-variable
在函数中,我试图
将
0赋值给更
频繁
的
字符串
,
将
1赋值给更少
的
字符串
。我
的
想法是,它应该使用任何带有二进制
字符串
的
列,并且基于值计数,赋值为0和1。
浏览 2
提问于2022-05-19
得票数 -1
回答已采纳
2
回答
Lucene.Net适合作为
频繁
变化内容
的
搜索引擎吗?
search
、
lucene
、
indexing
、
lucene.net
Lucene.Net适合作为
频繁
变化内容
的
搜索引擎吗?关于解决
浏览 2
提问于2008-11-07
得票数 12
回答已采纳
点击加载更多
热门
标签
更多标签
云服务器
对象存储
ICP备案
云点播
腾讯会议
活动推荐
运营活动
广告
关闭
领券