腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(5133)
视频
沙龙
1
回答
模糊
(
文本
/
字符串
)
与
AI
匹配
(
用于
处理
常见
缩写
)
、
、
、
、
:2)我有一个有名字的300.000个火车/汽车站的列表B(当然拼写略有不同) 3)假设B的150.000个元素,我知道A中的精确
匹配
4)我希望B中的另一半元素
与
A
匹配
(假设我们知道有
匹配
)。我知道这里有很多关于这种
模糊
文本
/
字符串
匹配
的类似问题,但我发现令人不满意的是,它们或多或少都依赖于像Levenshtein距离这样的算法,如果你的
文本</
浏览 26
提问于2020-02-19
得票数 2
1
回答
带有缩略语的
字符串
匹配
.
模糊
匹配
、
、
、
、
我很难
匹配
字符串
。大部分的困难集中在
缩写
上。我的第一个漏洞是使用
字符串
包
模糊
<em
浏览 3
提问于2022-03-07
得票数 4
回答已采纳
1
回答
就地词组/符号Dabbrev展开
、
、
、
据我所知,这是我对d
缩写
扩展的扩展,以支持子
字符串
expansion.It的工作。为什么这种模式在嬉皮士/数字
缩写
扩展中不可用,是否有一种更好的方式来查询它?
浏览 1
提问于2011-12-08
得票数 1
1
回答
选择
与
括号
匹配
的单词
、
我试过了但是,当存在这样的完整表单时,提取就会失败下面是
用于
测试的
文本
:: 从生物医学文献中自动提取缩略语定义对的任务有在过去的几十年里,人们使用自然语言
处理
(NLP)的技术研究了大多数
常见
的信息获取(MCM),几乎完全针对英语。本节167介绍了一些应
用于
首字母
缩写
识别任务的方法和技术。Taghva和Gilbreth (1999年)介绍了
缩写
浏览 2
提问于2020-07-06
得票数 1
回答已采纳
2
回答
Oracle中的
模糊
文本
搜索
、
、
在我的应用程序中,我接受一个地址
字符串
作为输入,并希望检查该地址
字符串
的特定子
字符串
是否
与
表中的一个或多个街道名称
匹配
,这样我就可以将该地址子
字符串
标记为街道名称。显然,这应该是一个
模糊
文本
匹配
问题,我查询的子
字符串
与
DB表中的街道名称完全
匹配
的可能性很小。因此,应该有一种
模糊
文本
匹配
方法。但它们似乎
用于
更复杂
浏览 3
提问于2014-08-12
得票数 15
回答已采纳
2
回答
在loadBeforeSend上设置jqGrid网址
、
、
我有一个wcf服务,
用于
向jqgrid返回json数据的大量报告。一切都如期而至。但是,由于每个报表查询都有大量的用户输入,所以我选择使用
与
服务器上的一系列“输入模型”相
匹配
的json
字符串
。我不想在我的路线上
处理
冗长复杂的查询
字符串
。 问题:如何添加jqGrid查询
字符串
params,将我的json
字符串
上传到服务器?我尝试过'loadBeforeSend‘,但是我似乎不能覆盖ajax。我的jqGrid函数(
缩写
为简洁):
浏览 4
提问于2011-06-09
得票数 3
回答已采纳
3
回答
如何在
字符串
中找到(
模糊
)
匹配
的位置?
、
、
我在R中有一个
文本
处理
问题,我想在一个
字符串
中得到一个字符,在这个
字符串
中,一个不同的
字符串
与
某个编辑距离进行精确
匹配
和/或
模糊
匹配
。例如:B = "match"我想返回一些信息,告诉我
字符串
A中的第5个字符是搜索B和C的
匹配
位置。我所知道的所有模式
匹配<
浏览 8
提问于2017-07-22
得票数 0
回答已采纳
2
回答
从大型
文本
语料库中的给定术语列表中找到最相似的术语。
、
、
、
此外,我有一个巨大的
文本
语料库从一个子-Reddit(帖子,评论,线程等)我们列表中的播客经常被用户提及。我想要解决的任务是,我必须用我们的语料库中的每个名字来计算提到的次数。我尝试过的:首先,我
处理
并连接原始播客名称中的所有单词为一个单词。例如,“国会听取技术政策辩论”( "Congresshearstechpolicydebates" ) ->"congresshearstech" (
浏览 5
提问于2021-10-30
得票数 0
回答已采纳
2
回答
字符串
间的
缩写
相似度
、
、
、
在我的项目中,我有一个用例,需要将key-string
与
许多
字符串
进行比较,以获得相似之处。如果这个值大于某个阈值,我认为这些
字符串
“类似”我的key,并且基于这个列表,我做了一些进一步的计算/
处理
。我一直在探索
模糊
匹配
字符串
相似度,它使用基于edit distance的算法,如"levenshtein,jaro和jaro“的相似点。虽然它们运行良好,但如果一个
字符串
是另一个
字符串
的“
缩写
”,我希
浏览 17
提问于2022-06-27
得票数 7
回答已采纳
4
回答
美元元字符中的“
字符串
结尾换行符”是什么?
、
、
、
、
关于^,只描述了两个明确的备选方案: $的另外两个
常见
含义是
浏览 9
提问于2020-03-07
得票数 2
回答已采纳
2
回答
VBA Find (LookAt=xlWhole)将始终返回错误
、
、
我在一个VBA代码中有一个搜索函数,
用于
搜索A列。A列被首字母
缩写
词填充,B列中的相应行就是该首字母缩略词的含义。我有一个用户表单设置,用户可以输入一个
缩写
词,如果它在文件中,它将显示一个消息框,说明该缩略词的意思。我正在尝试搜索
与
用户输入的首字母
缩写
完全
匹配
的内容,如下所示:但是,当我运行它时,即使我复制了一个包含首字母
缩写
的单元格并将其粘贴到用户表
浏览 8
提问于2015-07-15
得票数 0
回答已采纳
8
回答
使用Levenshtein距离
匹配
的
匹配
百分比排名
、
、
、
我正在尝试使用Levenshtein距离算法将单个搜索词
与
可能
匹配
的字典进行
匹配
。该算法返回一个距离,表示为将搜索
字符串
转换为
匹配
字符串
所需的操作次数。由于搜索
字符串
可以比各个字典
字符串
更长或更短,那么
用于
将距离表示为百分比的适当逻辑是什么,这将定性地反映每个结果与查询
字符串
有多接近,其中100%表示精确
匹配
。例如查询"ABC“
与
"ABC Corp.”
匹
浏览 1
提问于2012-05-02
得票数 27
1
回答
Python-查找DataFrame列(刮过的
文本
)和
字符串
列表之间的
匹配
字符串
。
、
、
、
我很难将DataFrame列中的
字符串
与
字符串
列表进行比较。让我解释一下:我为一个个人项目从社交媒体收集数据,除此之外,我还创建了一个
字符串
列表,如下所示:1 Title@ 'Yeaaah toda
浏览 2
提问于2021-10-31
得票数 0
回答已采纳
2
回答
用预先设置的Python / PHP名称列表识别命名实体
、
、
、
、
我正在尝试
处理
一个CSV文件,该文件在每一行中都有一个
文本
字段,其中包含组织名称和个人在该组织中的位置,作为非结构化
文本
。这个字段通常是这样混乱的
文本
: Assoc.我有一个包含大约16,000个组织名称的MySQL表,我可以为其执行一个简单的preg_match,但是由于
常见
的拼写错误和
缩写
,它只捕获了大约30%的组织。,我不能花时间纠正目前没有正确
处理
的70%的记录,或者为每个组织创建多个别名。我想要做的是捕捉到一些小的差异(比如拼写错误、连字符和空格,以及
浏览 2
提问于2010-11-17
得票数 0
1
回答
SQL编辑距离:您过去是如何使用SQL
处理
模糊
字符串
匹配
的?
、
我一直想问你对这个话题的看法,所以我们开始吧:您将哪些规则/过滤器应
用于
模糊
数据
匹配
的结果,以减少手动
匹配
量? 我指的是这样的规则:如果
字符串
超过20个字符,编辑距离<=为1,那么它可能是相同的,因此可以认为它是
匹配
的。如果
浏览 0
提问于2020-08-17
得票数 0
2
回答
MongoDB:如何存储人名以对多个名称执行索引不区分大小写的查询?
快速摘要:背景: 为了解决问题1,我们将病人的名字分开,并将其存储为数组。为了解决第二个问题,我们先用小写表示,然后再拆分它。我们还在按字典顺序对数组进行排序(不确定是否需要这样做?)
浏览 1
提问于2013-04-01
得票数 1
回答已采纳
1
回答
带评分的Lucene
模糊
短语搜索方法
、
、
我的要求是在
模糊
短语搜索中生成
匹配
分数。示例4)对每个
匹配
的文档进行后
处理
,定义每个
匹配
的三克标记在输入自由
文本
数据中的位置,并计算出可能的位
浏览 1
提问于2013-09-06
得票数 0
回答已采纳
0
回答
对5M条记录进行复杂
字符串
搜索的最好方法是什么?应用层还是DB层?
、
、
、
、
我有一个用例,我需要对大约510万条记录进行复杂的
字符串
匹配
。当我说复杂的
字符串
匹配
时,我指的是使用库进行
模糊
字符串
匹配
。() 我们在工作中使用的数据库是SAP Hana,它非常适合检索和查询,因为它在内存中,所以我希望避免从那里提取数据并将其重新填充到应用层的内存中,但同时我无法利用这些库( DB中有一个
用于
模糊
匹配
的API如果我对数据库中的单词进行预
处理
,并将其
与
用户可能搜索到
浏览 5
提问于2016-12-24
得票数 0
回答已采纳
1
回答
当条件满足值对和列表时创建新列表
、
我正在使用python3每个
缩写
都有一个对应的数字,这在csv文件中表示。我还有一个名字列表(list.txt),名字的第一部分通常是某种
缩写
。 该程序背后的想法是:我想分析csv文件,并在list.txt的名称中添加
与
缩写
相对应的数字。如果可能的话,输出应该是一个新的
文本
文件。上面的链接是我发现如何提取
匹配
字符串
的地方
浏览 34
提问于2017-07-05
得票数 3
回答已采纳
2
回答
ElasticSearch中的
模糊
设置
、
、
我的搜索引擎需要一种方法来
处理
搜索
字符串
中的小排字,并且仍然返回正确的结果。根据max_expansions,文档,在
文本
查询中有三个
与
模糊
匹配
相关的值:
模糊
性、ElasticSearch和prefix_length.。我知道
模糊
应该是0到1.0之间的浮点数,另外两个是整数。 有人能为这些参数推荐合理的“起点”值吗?我相信我将不得不通过尝试和错误调优,但我只是在寻找正确
处理
排字和拼写错误的大概值。
浏览 3
提问于2012-08-30
得票数 12
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
热门
标签
更多标签
云服务器
ICP备案
云直播
对象存储
实时音视频
活动推荐
运营活动
广告
关闭
领券