腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
7
回答
近似
字符串
匹配
算法
algorithm
、
string
在这里,我们通常需要从
字符串
列表中找到与其他输入
字符串
最匹配的
字符串
。目前,我们使用的是Needleman
算法
.该
算法
通常会返回大量的假阳性(如果我们设置的最低分数太低),有时它找不到匹配的时候,它应该(当最低分数太高),而且,大多数情况下,我们需要手工检查的结果。你对
算法
有什么经验吗?你知道这些
算法
是如何相互比较的吗?PS:我们正在用C#编写代码,但你不应该关心它--我是在问一般的
算法
。 哦,对不起,我忘了提这个。然
浏览 8
提问于2008-09-08
得票数 46
回答已采纳
3
回答
Light C Unicode库
c
、
unicode
、
utf-8
我正在寻找一个小的C库来
处理
utf8
字符串
。ICU (我发现它对于我在嵌入式设备上的用途来说太笨重了)有没有人发现了一些独立于平台的小代码库来
处理
unicode
字符串
(不需要进行归化
浏览 0
提问于2008-11-24
得票数 55
回答已采纳
1
回答
检测文件(或
字符串
)是否已被修补的
算法
string
、
algorithm
、
compare
、
patch
、
datediff
此问题与
字符串
算法
相关
,与版本控制工具或管理工具无关。 我学习了diff
算法
,并尝试实现了一个。也就是说,给定
字符串
A和
字符串
B,diff计算可以将A转换为B的一系列操作。我想知道,如果可能的话,给定一个
字符串
S,以及diff
算法
可以产生的一系列操作,
算法
将判断
字符串
S是否是(a)原始
字符串
A,(b)修补
字符串
B,(c)不
相关
的
字符串
。如果S只是
浏览 2
提问于2014-11-15
得票数 0
3
回答
如何修改后缀数组以搜索多个
字符串
?
algorithm
、
list
、
suffix-array
最近,我一直在更新
算法
知识,并一直在阅读后缀数组。我读过的每一篇文章都将它们定义为单个搜索
字符串
上的后缀数组,但有些文章提到了将其概括为整个搜索
字符串
列表的“琐碎”,但我看不出是如何做到的。假设我试图在一个单词列表上实现一个简单的子
字符串
搜索,并希望返回一个匹配给定子
字符串
的单词列表。但这似乎会产生大量不
相关
的条目。如果我创建一个源
字符串
‘香蕉$松饼’,那么我将生成‘安娜$松饼’的后缀,我将永远不会使用。我希望有任何关于如何正确
处理
这个问题的提示,或者
浏览 4
提问于2015-07-17
得票数 7
回答已采纳
5
回答
在拉丁文中匹配少于10个单词的两个
字符串
的最佳
算法
是什么?
java
、
lucene
、
string-matching
、
similarity
我在比较歌曲标题,使用拉丁文(虽然不总是),我的目标是一个
算法
,如果两个歌曲标题似乎是相同的标题,则给出高分;如果它们没有共同之处,则得分很低。现在,我已经不得不编写代码(Java)来使用Lucene和RAMDirectory来编写它--但是使用Lucene来比较两个
字符串
太重了,因此太慢了。现在我开始使用,它有许多比较两个
字符串
的很好的
算法
: ChapmanLengthDeviationChapmanMeanLength具体来说,
算法<
浏览 13
提问于2014-11-28
得票数 12
回答已采纳
1
回答
如何实现具有两个或更多键的散列函数?
c++
、
hash-function
我目前正在做C++的数据结构和
算法
学期项目。我想实现一个散列函数来使用一个人的姓名(
字符串
)和电话号码(整数)来访问他的数据。我还计划用开放寻址来
处理
冲突(如果这个信息是
相关
的)。
浏览 3
提问于2021-01-06
得票数 0
3
回答
SPARQL:如何找到相似的
字符串
?
java
、
sparql
、
jena
、
levenshtein-distance
、
similarity
有些对象是由
字符串
标识的,但有时完全相同的
字符串
不可用,因为我正在
处理
扫描的文档,因此可能会出现OCR错误。因此,我希望找到最相似的
字符串
。有没有办法使用SPARQL来达到这个目的?然而,一个有效的
算法
仍然需要使用SPARQL过滤掉不
相关
的
字符串
。
浏览 0
提问于2012-03-29
得票数 4
回答已采纳
2
回答
“你的意思是”在吉特里
algorithm
、
git
、
artificial-intelligence
、
copy-paste
我想写一个“你指的是”
算法
。当用户从一组单词中输入一个单词时,我需要给出建议。以上都是我问题的背景:))在git中用来实现‘you’
算法
来完成我的任务的代码。 您知道包含“您的意思”
算法
的git源文件的位置吗?
浏览 4
提问于2012-03-17
得票数 6
回答已采纳
1
回答
有没有比BK树更有效的模糊
字符串
搜索方法?
string
、
algorithm
、
fuzzy-search
对于一个
算法
类,我正在做一个研究任何特定
算法
的项目。我选择调查。BK树与模糊
字符串
搜索(例如拼写检查、单词推荐)
相关
联。然而,似乎BK树的执行速度并不快,甚至可能已经过时了。并没有太多好的学术资源。有没有更快、更有效的模糊
字符串
匹配
算法
? 谢谢!
浏览 1
提问于2012-04-28
得票数 1
回答已采纳
3
回答
java中的停用词和词干分析器
java
、
nlp
、
stop-words
、
porter-stemmer
我正在考虑在我的相似度程序中设置一个停用词,然后是词干分析器(选择porter1还是porter2取决于最容易实现的是什么)现在我得到了这些
字符串
词干分析:我是否可以直接对它使用词干分析
算法
,将其保存为
字符串
,然后像在程序中实现词干分析之前那样继续
处理
相似性,就像运行one.stem();之类的事情?我想继续
处理
字符串
,并在对其使用相似度<
浏览 1
提问于2011-05-25
得票数 4
1
回答
VB.NET使用Levenshtein
算法
比较文件
vb.net
、
comparison
我想使用Levenshtein
算法
来比较VB.NET中的两个文件,我知道我可以使用MD5散列来确定它们是否不同,但我想知道这两个文件有多大的不同。我
处理
的文件大小都在250兆左右。我已经尝试过不同的方法,我意识到我真的不能将两个文件都加载到内存中(所有与
字符串
相关
的问题)。所以我想我只需要流式传输我需要的字节。很好。但我发现的Levenshtein
算法
的实现都是长度为1*长度2的矩阵的维度,在这种情况下,这是不可能
处理
的。我听说有一种方法可以只使用两个向量而不是整个矩阵。
浏览 0
提问于2012-10-10
得票数 1
回答已采纳
1
回答
Accord.net编码不能
处理
非
字符串
accord.net
我正在尝试使用Accord.net library来构建库支持的几种机器学习
算法
的测试方法。我遇到的一个问题是,当我尝试对
字符串
数据进行编码时,尽管文档中另有说明,但编码类似乎无法
处理
任何不是
字符串
的datatable列。‘“ 编辑:事实证明,这个错误是因为编码系统只有在对整个表进行编码时才能
处理
替代数据类型。我想我可以看到这里的逻辑,尽管我更喜欢更好的错误,或者方法更聪明一点。 我现在有另一个与此
相关
的问题。因此,下一步将是获取一组测试数据,确保它与码本编码匹配,并通过
算法</
浏览 17
提问于2019-10-17
得票数 1
回答已采纳
1
回答
多核
处理
器上RTOS中的群组调度
algorithm
、
embedded
、
multicore
、
scheduler
、
rtos
据我所知,Gang调度是一种并行系统的调度
算法
,它调度
相关
的线程或进程在不同的
处理
器上同时运行。使用成组调度,以便当两个或更多线程或进程彼此通信时,它们都准备好同时通信。然而,群组调度
算法
如何确定特定的进程集将在它们之间进行通信,从而调度
相关
的线程或进程在不同的
处理
器上同时运行?
浏览 0
提问于2010-06-17
得票数 4
1
回答
如何通过相似性知道句子中包含了哪些特定的
字符串
?
python
如何通过相似性知道句子中如何包含特定的
字符串
?? 例句:社区在这里帮助您
处理
特定的编码、
算法
或语言问题。具体
字符串
:
算法
相似性: 0.8248242 (
算法
-
算法
) 帮助我.
浏览 1
提问于2021-11-10
得票数 1
4
回答
使用多核
处理
器需要多线程
算法
吗?
java
、
multithreading
、
multicore
我只是想知道我们是否真的需要这个
算法
是多线程的,如果它必须使用多核
处理
器,或者jvm是否会使用多核的,尽管我们的
算法
是顺序的?
相关
问题:
浏览 1
提问于2010-10-01
得票数 11
回答已采纳
1
回答
是否有任何
算法
将大约40k字符减少为2-3k字符?
java
、
android
、
string
、
algorithm
、
qr-code
我一直在做这个项目
相关
的QR代码,我停留在这个阶段,我必须生成一个QR代码,其中包含关于其他10K QR代码(批
处理
)的信息。我想在每个QR代码的哈希代码中接受前4个字符( 10k批
处理
),这样每次生成的QR代码都是唯一的(即使一对100 QR代码在10K批中发生了更改)。只有数字最大。2953个字符提前谢谢。
浏览 3
提问于2019-12-01
得票数 0
2
回答
监督聚类用例?
machine-learning
、
python
、
clustering
、
supervised-learning
我目前正在
处理
一个问题,在这个问题上,我认为有监督的聚类方法可能是一个很好的候选方法,但我不确定,以前也没有真正
处理
过这样的场景。让我把它分解一下:也许有更好的方法
浏览 0
提问于2021-10-06
得票数 0
1
回答
异常的通用容器
c++
、
exception
、
exception-handling
处理
异常对于代码安全和防止不需要的条件作为后续例程/
算法
的输入非常重要。另一方面,使用try/catch/throw语句填充代码会降低代码的可读性。有没有什么编程技术可以帮助避免把异常
处理
和
算法
相关
的代码混在一起? 谢谢,
浏览 0
提问于2011-03-19
得票数 1
回答已采纳
1
回答
Perl使用什么散列函数/
算法
?
perl
、
function
、
hash
您能介绍一下Perl用来将
字符串
映射到索引的散列函数/
算法
吗?有
相关
的读物吗?
浏览 2
提问于2012-06-27
得票数 8
回答已采纳
6
回答
在Java中,我应该如何
处理
一个非常大的数组?
java
、
nio
我有一个
算法
,它目前分配了一个非常大的双精度数组,它经常更新和搜索。数组的大小是N^2/2,其中N是
算法
运行的行数。我还必须保留整个东西的副本,以便与
算法
周围的应用程序
相关
联。当然,这对我的
算法
可以
处理
的行数施加了限制,因为我要
处理
堆限制。到目前为止,我已经让使用该
算法
的人更新-Xmx设置以分配更多空间,这样做效果很好。我已经计划改变我的
算法
,以减少这个大型数组的必要性,并在该领域取得了一些有希望的结果。因此,当我在完善我的
浏览 0
提问于2009-12-17
得票数 9
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
字符串相关算法
字符串算法
算法字符串匹配-BF算法
算法—字符串压缩
字符串加密处理
热门
标签
更多标签
云服务器
即时通信 IM
ICP备案
对象存储
实时音视频
活动推荐
运营活动
广告
关闭
领券