根据字符串相似度拆分列

、、

------++------------+| A BC 456ac |+------------+ 我想根据组中最小的字符串对相似的字符串进行分组，并将字符串的其余部分拆分到一个新列中，如下所示： +------+-------++------+-------+| ABC

浏览 57提问于2021-09-13得票数 0

1回答

在Cypher/Neo4j中使用REDUCE迭代2个列表

、、、、

我有一个相似度列表和一个评分列表，我想在Neo4j中的图表上计算查询中的加权平均值使用REDUCE(x = 0，相似性中的i和评级|x+i*j中的j)*1.0/ REDUCE(y = 0，相似性中的k

浏览 0提问于2014-11-03得票数 2

1回答

如何对字符串数组运行spaCy的句子相似度函数以获得分数数组？

、、、、

我必须将一个spacy文档与spacy文档的列表进行比较，并希望获得相似度得分列表作为输出。当然，我可以使用for循环来做到这一点，但我正在寻找一些优化的解决方案，比如numpy提供的广播等。compared with a list of documents' listDocs = ["I'm the first one", "I'm the second one"] spaCy为我们提供了文档相似度函数doc in enumerate

浏览 17提问于2019-05-10得票数 0

回答已采纳

3回答

获取多个字符串的相似度百分比

、、、

在Python中有没有什么函数可以接受多行字符串并返回它们相似度的百分比？类似于SequenceMatcher，但用于多个字符串。例如，我们有以下句子 Hello how are you?我希望能够根据句子之间的相似程度获得百分比假设我们有这三句话 Hello how are you?Hello how are you?那么我们应该得到100%相似的结果但如果我们有 Hello how are you? Hello how

浏览 28提问于2018-12-17得票数 0

回答已采纳

2回答

字符串操作:计算“字符串及其后缀的相似度”

、

对于两个字符串A和B，我们将字符串的相似度定义为两个字符串共有的最长前缀的长度。例如，字符串"abc“和"abd”的相似度为2，而字符串"aaa“和"aaab”的相似度为3。问题是给出一个算法来计算字符串S与它的每个后缀的相似度之和。例如，假设字符串为：ababaa。然后，字符串<

浏览 4提问于2011-12-16得票数 5

回答已采纳

1回答

文本数据的长度是否影响聚类的得分？

、

我有一个句子(字符串)的列表。我想知道，字符串的长度是否会影响silhouette_score。

浏览 0提问于2019-09-07得票数 1

回答已采纳

2回答

python代码在字符串重复搜索中的优化

、、、

我们有一个很长的字符串列表(大约18k个条目)。目标是找到所有相似的字符串，并根据最大相似度对它们进行分组。("a“是带字符串的列表)def diff(a, b):每件事都运行得很好，但由于列

浏览 3提问于2012-03-24得票数 3

回答已采纳

1回答

如何在sql server 2014中获取近似搜索结果

在搜索字符串values.It时，如何编写sql过程来获得匹配结果，应该根据用户输入的字符的相似度来进行搜索。例如，艾哈迈德或穆罕默德，穆罕默德，穆罕默德等应该在执行搜索时显示所有相似的名称。

浏览 0提问于2016-09-27得票数 0

1回答

如何比较使用两个不同的数据集获得的两个相似性？

、

我试图通过使用两个不同的数据集通过余弦相似度来计算用户与用户的相似度(用户是相同的，只是为了获得相似度而考虑的特征在数据集之间是不同的)。现在，有没有一种方法可以根据相似度值来判断这两个数据集有多相似？

浏览 0提问于2017-05-22得票数 0

2回答

计算句子集合之间的语义相似度

、、、、

我有两组短消息，我想计算这两组短消息之间的相似度，并根据它们的语义相似度来识别它们是否在谈论相同的子主题。我知道如何使用成对相似度，我的问题是我想计算两个集合中所有句子之间的总体相似度，而不是两个句子的相似度。有没有办法使用tf-idf或带有余弦相似度的word2vec/doc2vec来计算总分？

浏览 4提问于2019-08-02得票数 0

3回答

如何优化这段Python代码才能运行得更快？

、、

这就是程序试图解决的问题：程序应该输出输入字符串及其所有后缀的相似度之和。即对于AAAB，它应该输出相似度(AAAB，AAAB) +相似度(AAAB，AAB) +相似度(AAAB，AB) +相似度(AA

浏览 1提问于2012-01-05得票数 1

回答已采纳

2回答

解压列表理解中的拆分

、、

如果我想根据文档的行元素生成一个元组列表，我可以这样做：[(linesplit0, linesplit1[3:8]) for line in open("doc.txt") for (linesplit0, linesplit1我想要的是允许对拆分产生的列表使用占位符名称(比如拆分列表或其他什么)，并且可以与索引(拆分列<

浏览 0提问于2017-04-27得票数 5

回答已采纳

2回答

在mysql中查找相似语句

、

根据，有几种方法可以计算两个字符串之间的相似度。 Soundex是一个非常差的算法，目前可以在mysql上使用。mysql有没有其他可用的方法实现？

浏览 5提问于2009-08-25得票数 3

回答已采纳

2回答

红移中相似度的等价

、、

Postgresql有一个叫做相似度的函数，它根据两个不同单词的相似度返回一个数字。例如相似度(‘postgre’，postgra')它将返回0.5。

浏览 0提问于2021-05-11得票数 1

1回答

如何使用K-medoid算法根据不确定数据的概率分布相似性对其进行聚类？

如何根据不确定数据的概率分布相似度对其进行聚类?如何根据不确定数据的概率分布相似度使用K-medoid算法对不确定数据进行聚类？

浏览 0提问于2013-09-27得票数 0

1回答

如何根据相似度矩阵对大量字符串进行聚类？

、

我需要根据500K+字符串的相似性对其进行聚类。我已经计算了它们成对的Levenshtein距离，并制作了一个稀疏相似矩阵。此矩阵包含二进制相似性:较小距离的值设置为1.0，其他距离的值为0.0。我不知道什么样的集群对我有好处。我事先不知道聚类的数量，但它可能相当大，因为相似度矩阵非常稀疏(大约0.1%的值是非零的)。

浏览 38提问于2021-01-14得票数 0

回答已采纳

1回答

基于字典的字符串匹配算法-- Java

、、

Java中有没有基于字典的字符串匹配算法？可以根据字典给出两个字符串之间的相似度百分比？

浏览 2提问于2013-01-13得票数 0

回答已采纳

3回答

如何根据发音计算英语单词之间的相似度分数？

、

有许多流行的算法可以根据发音将英语单词编码为字符串。例如，soundex代码是由单个字母后跟三个数字组成的四字符串。有没有一种有效的方法来计算0到1之间的相似度分数？

浏览 1提问于2016-08-12得票数 0

4回答

如何在C++中快速比较可变长度的位串？

、、、

我正在根据一组特征的二进制存在与否来执行对象的比较。这些功能可以用位字符串表示，如下所示：该位串具有第一、第四和第五个特征。s(10011,10010) = 2 如何在C++中有效地表示和比较位串？

浏览 1提问于2011-01-26得票数 3

回答已采纳

2回答

C中的字符串相似度

、

对于两个字符串A和B，我们将字符串的相似度定义为两个字符串共有的最长前缀的长度。例如，字符串abc和abd的相似度为2，而字符串aaa和aaab的相似度为3，计算字符串S与其每个后缀的相似度之和这是我的解决方案。

浏览 4提问于2012-01-15得票数 1

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

在Cypher/Neo4j中使用REDUCE迭代2个列表

如何对字符串数组运行spaCy的句子相似度函数以获得分数数组？

获取多个字符串的相似度百分比

字符串操作:计算“字符串及其后缀的相似度”

文本数据的长度是否影响聚类的得分？

python代码在字符串重复搜索中的优化

如何在sql server 2014中获取近似搜索结果

如何比较使用两个不同的数据集获得的两个相似性？

计算句子集合之间的语义相似度

如何优化这段Python代码才能运行得更快？

解压列表理解中的拆分

在mysql中查找相似语句

红移中相似度的等价

如何使用K-medoid算法根据不确定数据的概率分布相似性对其进行聚类？

如何根据相似度矩阵对大量字符串进行聚类？

基于字典的字符串匹配算法-- Java

如何根据发音计算英语单词之间的相似度分数？

如何在C++中快速比较可变长度的位串？

C中的字符串相似度

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐