在R中，我们可以比较按列划分的行以返回相似性分数吗？

这是我的数据集的一个示例。 df <- data.frame("TITLE" = c("GOOGLE", "GOOGLE INC.", "GOOGLE LLC"), "ADDRESS" = c("123 ABC DR", "123 ABC DR", "123 ABC DR") 我希望看到一个名为SIMILARITY_SCORE的新列，它将计算列</em

浏览 19提问于2021-11-22得票数 0

1回答

静态数据的大型电子表格:关系数据库还是平面文件？

ruby-on-rails、database-design

我有一个大约1500行x1500列的电子表格。顶部和侧面的标签是相同的，单元格中的数据是两个输入的量化相似性分数。我想做一个Rails应用程序，允许用户输入行和列值并检索相似度分数。相似性分数是根据经验得出的，不能由控制器以数学方式产生。一些注意事项:在每个单元满的情况下，超过一半的

浏览 0提问于2011-10-18得票数 0

回答已采纳

2回答

Excel近似文本匹配

string、excel、match、vlookup、approximate

我正在尝试检查A列中有多少个字符串与B列中的字符串大致匹配。示例：如果B列中有字符串"angry_birds_iph_app“，而A列中出现了"angry_birds_iph_app”和"angry_birds_adrd_app“，我希望函数返回2。

浏览 11提问于2013-02-12得票数 5

2回答

Excel，索引查找水平值

excel、indexing、vlookup

我有一张有计划的桌子。我们的志愿者按列排列，日期按行排列。当他们有责任时，我们用"x“来标记：因此，当我选择“周日16-

浏览 1提问于2018-12-10得票数 0

1回答

用Python中的模板字符识别车牌字符

python-3.x、image-processing、character、detection、image-recognition

在大学项目中，我必须识别车牌上的字符。我必须使用python 3，我不允许使用OCR函数，也不能使用使用深度学习或神经网络的函数。我已经到了能够将字符从车牌中分割出来并将它们转换成统一格式的地步。此外，我有一组模板字符和数字，可以用来预测它是什么字符/数字。因此，我需要一个度量来表示分割字符和参考图像之间的相似性。这样，我可以说，相似度最高的参考图像与分割字符匹配。对于这些操作，我已经确保引用字符和分段

浏览 1提问于2021-02-28得票数 0

回答已采纳

1回答

雪花中的相似搜索

snowflake-cloud-data-platform

目标：在雪花数据库中实现一个SQL查询，该查询给定一个类似地址的字符串(用户输入)，对单个字段执行模糊/近似搜索，并根据该分数返回具有相似性评分的结果。很好，但缺少一个简单的示例，它似乎关注两个表的相似性，而不是将任意字符串与列中的值进行比较。WHERE FullAddress LIKE user_input; 我知道它有更多，但只是不

浏览 16提问于2022-07-18得票数 0

回答已采纳

1回答

数以百万计的文档之间的相似性度量

python、scalability

我想找出每个文档之间的相似性以及一个分数。所以我想要的是第一行和所有其他行之间的相似性，第二行和所有其他行之间的相似性等等。因此，每个文档都应该与其他文档进行比较。得到相似的分数。我的目的是查询我的数据

浏览 0提问于2017-07-27得票数 -1

回答已采纳

1回答

在Lucene中越近越好

java、elasticsearch、lucene、similarity

现在，我想知道“越近越好”功能是否存在/或者在Lucene中易于实现：我希望将文档的creation_date作为unix时间存储到浮点字段中。然后，我希望能够将查询中给出的unix时间与文档的索引unix时间进行比较。我不想使用范围查询(检查范围是否在特定边界之间)或布尔查询(检查值是否相同)，而是希望能够根据unix时间之间的时间返回一种相似性感。如果时间范围很小，

浏览 8提问于2015-09-22得票数 0

回答已采纳

2回答

Lsh算法和频带

algorithm、nearest-neighbor

我读了很多关于lsh算法的资料，但我有一个关于它的问题，完全是在频带上。S1S3 = {1, 2, 4, 9} //band signatures for set S3 当我在一个确定的波段b中得到一个集合(例如S1)的所有minwise签名时，我必须做什么？

浏览 1提问于2015-04-02得票数 0

1回答

余弦相似性分数的阈值确定/预测

nlp、transformer、semantic-similarity

给定一个查询语句，我们使用基于转换的语义文本相似性模型在语料库中搜索并找到相似的句子。对于第三个查询句，我们可能只得到100个类似的句子，分数从0.71到0.11不等。在所有这些情况下，是否有一种方法可以</e

浏览 0提问于2022-09-13得票数 1

回答已采纳

2回答

mysql从总体上比较3列的顺序

mysql

我有一个游戏，用户可以保存在那里的名字和得分在一个数据库。名称、尝试、正确百分比、时间、图像集尝试，正确百分比，所用时间，有没有办法比较分数呢？这是一个2分的例子第二<em

浏览 5提问于2014-01-21得票数 0

回答已采纳

1回答

如何度量三个向量之间的相似性？

sas

如何度量三个向量之间的相似性？假设我有三个学生和他们的科目成绩。学生1 (12,23,43,35,21)现在我想测量这三个学生之间的相似性。有人能帮我吗。提前谢谢。

浏览 3提问于2014-12-31得票数 0

1回答

空间-将相似函数应用于熊猫行中的文档

python、pandas、spacy

对于存储在熊猫系列(行)中的文档，我有一个关于相似性()操作的问题。我对文档中的所有名词进行了标记和提取，然后将它们作为标记列表传递给另一列。现在，我想计算它们之间的相似性。row_second中的名词之间的相似性 for row_first, row_second in itertools.combinations(df.no

浏览 1提问于2019-11-29得票数 1

2回答

在MySQL搜索中使用levenshtein搜索一个结果

php、mysql、sql

我正在尝试对我的MySQL数据库进行搜索，以获得包含与所搜索的值最相似的值的行。即使最接近的结果非常不同，我仍然想返回它(稍后我会进行字符串比较，并将‘未知’添加到学习池中)这里我不太理

浏览 25提问于2017-07-07得票数 0

回答已采纳

2回答

匹配400万行数据并根据相似性排序结果的最佳方法？

string、algorithm、comparison、similarity

我们使用拼图( )对400万幅图像进行相似性比较。但是，与其使用lib谜函数进行图像与图像的比较，还有另一种比较图像的方法。这里是一些快速背景： Lib谜为任何给定的图像创建一个相当小的散列(544字节)。这个散列可以反过来用来与其他散列进行比较，使用lib谜函数。有一些API..。PHP，C等.我们正在使用PH

浏览 1提问于2013-03-30得票数 3

2回答

如何根据Python中的相似性或重叠比较两个集群分组？

python、machine-learning、cluster-analysis、k-means、similarity

很明显，这两种聚类方法对数据进行了不同的聚类。我希望能够量化这种差异。换句话说，我可以使用什么度量来确定从这两个算法中获得的两个集群组之间的百分比相似性/重叠？以下是可以给出的一系列分数： ~20%的[(A,B),(C)]和[(A,B,C

浏览 3提问于2017-07-13得票数 6

回答已采纳

2回答

实现聚类的邻近度矩阵

r、machine-learning、cluster-analysis、data-mining

请原谅，我是这个领域的新手，所以如果这个问题听起来微不足道或基本的话，请原谅。或者，在这个领域，你通常是如何处理这类问题的。我使用perl和R来实现这一点。下面是我用perl编写的一个典型代码，它从包含我的词袋的文本文件中</e

浏览 0提问于2011-08-09得票数 6

回答已采纳

2回答

计算字符串矩阵间相似核的最快方法？

python、arrays、numpy、matrix、vectorization

假设我有一个由5个矩阵组成的列表，名为data。每个矩阵都有任意数目的行，但恰恰包含3个字符串的3列。我想训练一个高斯过程模型，假设data是我的训练集。我要根据每一对矩阵的字符串匹配来计算相似核。让我们以前两个矩阵为例。它们分别有4行和3行。我想检查所有4 x 3对的字符串匹配。在每对字符串中，我们说每对字符串之间的差异(仅比较</em

浏览 1提问于2021-07-25得票数 1

回答已采纳

1回答

星火中的分区与数据湖中的分区

apache-spark、pyspark、apache-spark-sql、databricks、data-lake

当将文件写入Data时，特别是通过Databricks，我们可以选择指定分区列。这将根据数据集中该列中可用的值将数据保存在单独的文件夹(分区)中。据我所理解，如果我们只想读取数据的某些部分(当然是基于分区列)，将数据保存在分区中的<

浏览 2提问于2022-05-10得票数 0

回答已采纳

1回答

两个不同长度的数据列之间的余弦相似性？

python、pandas、dataframe、cosine-similarity、name-matching

df1中有text列，df2中有text列。df2的长度与df1的长度不同。我想计算df1text中的每个条目和df2text中的每个条目的余弦相似度，并给出每一场比赛的分数。60suresh suresh 100当我试图匹配这两列</e

浏览 4提问于2019-12-31得票数 5

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

静态数据的大型电子表格:关系数据库还是平面文件？

Excel近似文本匹配

Excel，索引查找水平值

用Python中的模板字符识别车牌字符

雪花中的相似搜索

数以百万计的文档之间的相似性度量

在Lucene中越近越好

Lsh算法和频带

余弦相似性分数的阈值确定/预测

mysql从总体上比较3列的顺序

如何度量三个向量之间的相似性？

空间-将相似函数应用于熊猫行中的文档

在MySQL搜索中使用levenshtein搜索一个结果

匹配400万行数据并根据相似性排序结果的最佳方法？

如何根据Python中的相似性或重叠比较两个集群分组？

实现聚类的邻近度矩阵

计算字符串矩阵间相似核的最快方法？

星火中的分区与数据湖中的分区

两个不同长度的数据列之间的余弦相似性？

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐