Leveinshtein和散列-找到一个导致相关性的散列算法(更近距离)_BCrypt是一个在C#中使用的好散列算法吗？我在哪里可以找到它？ - 腾讯云开发者社区

hash

通常，散列的目标是将连续函数转换为离散函数:输入中的小变化应该会导致输出中的大变化。然而，有没有什么散列算法可以(非常)粗略地说，对于相似的输入返回相似但(仍然不同)的散列？ (使用这种方法的一个例子是检查两个文件是否“相似”，方法是检查它们的散列是否相似。当然，有些失败总是可以接受的。)

浏览 2提问于2011-01-29得票数 8

回答已采纳

2回答

如何找到发货的最佳仓库位置？

php、mysql、geolocation

我有以下问题要解决。我们想从美国各地的几个仓库发货。让我们假设这些仓库中的产品总是有库存。当有人下订单时，我希望选择最好的仓库发货，以最大限度地减少运输成本和运输时间。要自动测量可能的仓库和发货地址之间的距离并选择离客户最近的仓库，有什么好的解决方案？我期待着一个更理论的答案，但如果它有帮助，目标平台是一个PHP + MySQL为基础的网上商店。

浏览 3提问于2013-02-15得票数 1

回答已采纳

1回答

如何在KNeighborsClassifier中使用metric='correlation‘

python、python-3.x、machine-learning、scikit-learn、knn

我正试着用 KNeighborsClassifier(n_neighbors=15，algorithm=‘球树’，度量=‘相关性’) 但是，我得到了这个错误相关性:度量值‘ValueError’对算法'ball_tree‘无效为什么不能使用ball_tree？我是不是只能使用蛮力？我有一个巨大的矩阵，我想避免暴力。但是，我不能传入一个自定义度量来计算两个向量之间的皮尔逊相关性，因为三角形不等式没有保留。有什么替代方案吗？我在scikit-learn==0.18.1上

浏览 2提问于2017-03-25得票数 0

1回答

理解pdist与mdscale的结合使用

matlab、scale、cluster-analysis、pdist

我正在解决一个杂务问题。我有一套100 observatons。每个观察用三个特征来描述。我必须将这些观察分为两组(我有每个观察的标签)。在对观测数据进行聚类之前，我首先计算了观测值之间的pdist，然后使用MATLAB中的mdscale函数返回到三维。我使用transformed_observation作为k均值聚类算法的输入，与使用原始观测值相比，获得了更好的聚类结果(即，聚类与标签匹配)。任何人都能解释我为什么？我刚试过..。在这里你可以找到我的脚步..。 % select the dimensions of my features dimensions = 3; % gener

浏览 1提问于2016-01-26得票数 0

回答已采纳

1回答

用于比较相同输入的不同散列的散列算法

hash、cryptography、bcrypt、password-hash

我正在寻找一种散列算法，可以为每个输入生成许多散列，比如bcrypt，但与比较阶段不同的是，它应该可以比较许多散列中的一个，该散列可以通过输入的另一个散列为输入生成。例如： <code>A0</code>

浏览 2提问于2019-12-02得票数 0

回答已采纳

1回答

用MessageDigest理解Java中的哈希密码

java、cryptography、hash-function

我正在创建一个简单的web应用程序，并希望将散列密码存储到数据库中。我也需要身份验证令牌的散列函数(连接用户名和日期，并将它们连同散列一起发送到客户端作为令牌)。我发现Java类可以帮助我完成这个任务。。基本想法如下： public String digestString (String stringToHash) throws NoSuchAlgorithmException { MessageDigest sha256 = MessageDigest.getInstance("SHA-256"); byte[] stringBytes =

浏览 1提问于2012-01-04得票数 4

回答已采纳

2回答

将名义变量转换为数值变量？

machine-learning、classification、scikit-learn、categorical-data、numerical

我正试图开发一种算法，使用sklearn和Tensorflow来预测哪辆车可以提供给每个客户。为了做到这一点，我有一个数据库，其中包含了对1000名客户的一项调查的答案。问题/答案的一个例子是：颜色/绿色，红色，蓝色 NumberOfPax/2,4,5,6,7 马力/整数 InsuranceIncluded是/不是/不知道正如您所看到的，所有的问题都是以前提过的答案，如果答案是打开的，我将验证值是否为整数或单选按钮。这样做的目的是，尽管存在分类变量，但我可以很容易地使用sklearn对数据进行聚类。会不会是一种很好的方法，将这些类别转换为数值，作为实习生过程，然后用这些引用进行聚类

浏览 0提问于2018-07-20得票数 0

回答已采纳

1回答

消防部门覆盖范围

algorithm、computer-science

给定一组点(GPS坐标)和一个包含所有这些点的多边形，能否确定这些点覆盖该区域的程度，或者从多边形内的任何位置到最近点的最长距离是多少？例如，如果我在纽约市的边界内有所有的消防部门，我想知道在最坏的情况下，消防车要开多长时间(在紧急情况下)。对于这个问题的名称或者这个问题可以归结为什么，有什么想法吗？或者有任何现有的算法吗？谢谢您:)

浏览 3提问于2016-08-11得票数 1

回答已采纳

1回答

K-均值聚类，使质心不重叠节点。

python、cluster-analysis、k-means

我使用Python2.7实现了K均值++聚类，并按照中给出的方法得到了集群的质心。在我的问题中，还有一个进一步的限制，即任何质心到任何节点之间的距离应该大于一个常数。最好的方法是什么？有可能一个质心离几个节点太近了。关于如何让质心移动一点，有什么建议吗？非常感谢。例如，待集群的节点为: MyNodes = [469500、5802610、468764、5803422、467991、5804202、470260、5799949、469486、5800730、468713、5801510、467939、5802291、467166、5803072、467966、5800204、46719

浏览 2提问于2014-03-24得票数 2

回答已采纳

1回答

Python聚类数值数据

python、algorithm、cluster-analysis

我正在学习一个教程，其中“kmeans”算法是整个示例的主要部分。“行”列表作为要群集的数据传递。Pearson函数提供了第二个参数，一个相关系数，k=3是簇数。从kmeans函数返回的“最佳匹配”是与属于每个集群的行中的元素对应的分组/聚集索引值的列表。因为我需要做一个散点图，我需要他们的价值。如何返回值而不是索引的值？ rows=[(1,1),(3,6),(11,2),(7,19),(22,11),(32,11)] def pearson(v1,v2): #sums sum1=sum(v1) sum2=sum(v2) print(sum1) #sums of the sqs sum1S

浏览 3提问于2016-01-29得票数 0

回答已采纳

2回答

相似性算法？

algorithm、similarity

如果这看起来像是重复的，我很抱歉，但由于上一个问题似乎引起了一些混乱，这里是另一个开始。我有两个基本数组： float[] baseArr1 = new float[3] {0.430651724, 0.137407839, 0.177024469}; float[] baseArr2 = new float[3] {0.718210936, 0.001312795, 0.009634903}; 和另外两个数组进行比较： float[] compArr1 = new float[3] {1, 1, 1}; float[] compArr2 = new float[3] {1, 0, 0};

浏览 4提问于2011-06-18得票数 0

1回答

在Python中以两点之间的最小距离为约束从3D空间采样N个点的有效方法

python、loops、random、distance

我有200个数据点，每个点都是代表位置的3个数字的列表。我想从这个3D空间中采样N=100点，但有一个约束，即每两个点之间的最小距离必须大于0.15。下面的脚本是我采样点的方式，但它一直在运行，永远不会停止。此外，如果我设置了一个大于某个值的N，代码将无法找到所有N个点，因为我随机采样每个点，它会到达一个点，在这个点上，不能对不太靠近当前点的点进行采样，但实际上，如果点分布非常“密集”(但仍然满足大于0.15的最小距离)，N可能会比这个值大得多。有没有更有效的方法来做到这一点？ import numpy as np import random import time def get_ran

浏览 77提问于2020-09-16得票数 0

2回答

为什么一列列会导致我的SVM需要一个小时？

python、scikit-learn、svm

我在熊猫DataFrame上使用sklearn.SVC来预测分类数据。名为"feature_train“的特征向量是一个时间列(numpy.int64)和几千个tfidf列(非常稀少地包含tfidf值)： Timestamp Start able acceptance acceptance criterion access account 113 646 0.0 0.0 0.0 0.0 0.0 342 1775 0.0

浏览 0提问于2019-10-24得票数 1

1回答

用于消息身份验证的截断散列？

hash

我使用散列来验证消息的签名。由于散列将是用于QR代码的url的一部分，我想尽可能地保持散列的简短，以便生成一个不太复杂的qr代码，这是很容易扫描的。现在，我使用md5 hmac计算哈希，它已经生成了比SHA256更短的哈希(32)。但是它还不够短，我正在考虑截断散列以得到一个更短的哈希。假设长度为16。我想听听你对这种方法的看法，它能使散列容易被实际破解吗？还是有更好的方法？谢谢!

浏览 0提问于2014-10-14得票数 2

1回答

有人能建议我如何使用Spring从MySQL数据库中进行基于位置的搜索吗？

java、spring、spring-boot、spring-data-jpa、geolocation

我想根据特定点(纬度、经度)和半径(比方说R)从存储库的数据库中获取几行数据。我使用Spring和Spring和MySql作为数据库。你能提出一些技术或春天的一些特点，使我能够实现这一点吗？

浏览 3提问于2020-09-17得票数 1

回答已采纳

2回答

索引相似文本的散列函数

hash、similarity

我正在搜索一种散列函数来索引相似的文本。例如，如果我们有两个非常长的文本，分别称为"A“和"B”，其中A和B差别不大，那么应用于A和B的散列函数(称为H)应该返回相同的数字。所以H(A) = H(B)，其中A和B是相似的文本。我尝试了"DoubleMetaphone“(我使用意大利语文本)，但我看到它依赖于非常强的字符串前缀。例如： A=“这是我要散列的很长的文本”B=“这是非常长的文本” ==> doubleMetaPhone(A) = doubleMetaPhone(B) 这对我来说不太好，因为具有相同前缀的字符串可能会被比较为相似，我不希望这样。有没有

浏览 1提问于2010-07-14得票数 4

回答已采纳

1回答

如果我透露了一个原始的散列字符串的一部分，会不会很危险？

hash

这是一个关于散列的理论问题，我想知道如果我透露‘X’，散列(“XY”)是否会有危险。其中X可以是子字符串。考虑到最完美的哈希算法(从理论上讲)。

浏览 0提问于2020-02-27得票数 1

回答已采纳

1回答

机器学习相关性

machine-learning、correlation、pearson-correlation

我有一个数据集，我清理了它，现在在运行机器学习模型之前，我正在查看相关性。我读过关于人的r相关性的文章： Intermediate|0.0|，，，，，，，，，，，，，，，，，，我不明白几件事：独立列和独立列如果我有很强的相关性，它是好的还是坏的？Doe的强相关性(不是完美的1.0)意味着这两列基本上是相同的？，如果相关性是好的\坏的，我应该删除两列中的一列吗？独立列和依赖列如果我有很强的相关性，它是好的还是坏的？，如果相关性是好的\坏的，我应该删除独立列吗？

浏览 2提问于2021-05-06得票数 1

4回答

为每个用户分配唯一的比特序列的算法？

algorithm、math、binary、numbers

这个问题乍看起来很简单:只需分配一个id并用二进制表示即可。该问题的出现是因为用户能够将尽可能多的0位改变为1位。为了澄清，散列可以从0011到0111或1111，但永远不会是1010。每个位都有相同的机会被更改，并且独立于其他更改。假设用户进行低百分比的位篡改，您必须存储什么才能从散列->用户开始？我还假设在某些情况下会失败，因此正确的解决方案应该具有可接受的错误率。我估计被篡改的最大比特数大约是整个集合的30%。我猜可接受的错误率将取决于所需的散列数量和每个散列设置的位数。我担心有足够多的操作无法从散列中重建id。我想我想问的问题是，我可以使用什么安全卫士或独特的定位系统来

浏览 1提问于2009-12-11得票数 1

回答已采纳

1回答

A/B测试分区函数

statistics、ab-testing、hash-function、abtest

我想将我的用户分成几个组来运行A/B测试。通常的方法是将每个用户随机分配到一个变量，并存储该关系，直到A/B测试结束。但这将迫使我将该关联存储在某个地方，并且我希望避免它。因为用户已经在我的应用程序中注册了，所以我希望有一个在我的测试中统一分配用户的函数，这样我就可以在我的A/B测试中获得无偏差的结果。我应该使用哪种散列函数？

浏览 2提问于2012-11-23得票数 4

回答已采纳

1回答

理解最近对分治算法的困难

algorithm、time-complexity、divide-and-conquer

我刚开始编码，今天我在二维空间里完成了最接近对问题的解决方案。(2为循环) 然而，我放弃了在O(n log )中找到任何可以这样做的解决方案。即使在研究过它之后，我仍然不明白这怎么能比这个琐碎的方法更快。我所理解的是：->，首先，我们将数组分割成2个半个，然后只考虑X坐标对所有内容进行排序。这可以在n个日志中完成。接下来是递归调用，在每一半中“找到两个距离最低的点”。，但在O(n^2)以下是如何做到的呢?据我理解，如果不检查每一个点，就不可能找到N/2点之间的最低距离。在一维中有一个解决方案，对我来说绝对是有意义的。排序后我们知道，两个非相邻点之间的距离不能小于至少两个相邻点之间的

浏览 1提问于2020-04-07得票数 0

3回答

实心:距离相关大于1

python、python-2.7、scipy、correlation

我试图在列之间找到，请看下面的代码。大多数情况下，它返回大于1的结果，这是不可能的，因为距离相关在0到1之间。 import numpy as np from scipy.spatial import distance x = np.random.uniform(-1, 1, 10000) print distance.correlation(x, x**2) 1.00210811815 这里有什么问题，或者我怎么测量它？ upd1: github上的

浏览 1提问于2016-03-14得票数 9

回答已采纳

1回答

通用散列是否会在每个操作完成后再次选择新的散列函数？

algorithm、search、hash、insert、universal

我一直在读“算法导论”。我想知道通用散列是否会从散列函数集合中选择一个新的散列函数来进行下一次映射。例如，给定一个空表和一系列操作: insert、insert、search、delete、insert等，算法首先从集合中选择一个函数并执行第一个操作insert。那么，算法是选择一个新的散列函数来执行第二个操作，插入，还是使用在算法开始时选择的函数？提前感谢！

浏览 0提问于2013-08-13得票数 1

2回答

使用经纬度/Lon计算点A到线段的距离

java、android、gps、latitude-longitude

我正在开发一个使用GPS的Android应用程序。如果“新位置”(点C)离线段AB太远，我想知道是否有方法可以丢弃GPS位置数据。我使用的是点到线段公式found 。到目前为止，当我尝试使用纬度和经度坐标时，我得到的代码返回NaN。 private void verifyGPSLocation(Location start, Location end, Location current){ final double errorValue = 0.0000216; double normalLength = Math.hypot(end.getLatitude() - star

浏览 3提问于2013-02-11得票数 5

回答已采纳

1回答

给定一组具有颜色值的点，从给定的位置找到一个渐变颜色值。

mathematics、algorithm、vector、interpolation

我猜梯度的动词形式是“梯度”而不是“梯度”？嗨!我有一组2D点(实际上是3D的，但我们可以忽略Y轴，除非它是琐碎的)绑定到颜色值。我想知道，给定空间中的任意一点，如果所有定义的点之间都有平滑的梯度，那么颜色会是什么。这里可以看到这些点是什么样子。 📷 在上面的图像中，我期望颜色值是红色，青色，黄色和紫色点之间的一个大致相等的混合，围绕着吉兹莫的位置，因为它大约位于这四个点的中心位置。这比我原先预期的要复杂一些，因为：简单地平均所有的点和加权的距离是行不通的。如果我要求在红色点的确切位置的颜色，我想要红色的确切颜色-没有任何其他点的影响。同样，如果我在4个最近点的“四”内，就不应该有来

浏览 0提问于2021-12-14得票数 0

1回答

如何找到能供应给我的供应商？

algorithms

我无法搜索能够帮助我解决这个问题的算法，我不确定这个问题属于哪一类，或者使用哪种算法。问题陈述：供应糖的供应商有N个，每个供应商都有他们将供应的仓库的供应商位置(纬度、经度)，他们也有一个'maximum_radius‘，他们可以供应。现在，如果一个用户来给他的位置，用户的位置(纬度，经度)，我如何找到谁所有供应商可以供应到那个地方。如果到每个供应商位置，计算到用户位置的距离，并检查它是否在供应商的maximum_radius范围内，我可以考虑的唯一解决方案。但这似乎是缓慢的，因为供应商的数量将随着时间的推移而增加。

浏览 0提问于2016-06-08得票数 1

回答已采纳

1回答

数据复制优化

data、data-cleaning

我在python3的清洁数据工作。我有大量的midi文件使用beautiful soup从各种来源中抓取。许多文件可能是重复的音乐作品。我可以改变midis的键，使它们是相同的，并将乐器转换为钢琴(它们是单声道文件)。因此，应该可以检查歌曲内容(在midi编码方面)是否类似。它特别紧迫，因为有些文件上只有数字作为名称。因此，要明确的是，我必须检查文件的内容是否重复。另外，我不是在寻找精确的匹配，我只是在寻找百分之几的相似性。我目前的方法是使用Difflib中的SequenceMatcher。我正在检查每个单独文件上600的缓冲区是否有一个SequenceMatcher比率>9，然后，

浏览 0提问于2019-05-26得票数 1

1回答

避免没有秘密密钥的散列泛滥？

hash、collision-resistance、hmac

我目前正在构建一个发电机文件育托的实现。把它想象成一个巨大的、分布的、散列图。要找到保存密钥的节点，我使用会合散列 (与一致性散列相比)，这需要4哈希。为了避免哈希泛滥攻击，我使用一个键控哈希函数，使用客户端未知的密钥。我的目标是让客户端执行哈希而不是服务器。是否有一种替代键控哈希的方法，这样我就可以抵御散列泛滥攻击，但这样客户端本身就可以执行散列了吗？如果我使用的不是像xx散列这样的非密码散列，而是使用像blake这样的加密哈希，那么我能在防散列泛滥的同时丢弃密钥吗？

浏览 0提问于2022-08-29得票数 3

回答已采纳

1回答

如何利用西皮的Kd-树函数加速K-近邻(KNN)

python、pandas、machine-learning、scipy、scikit-learn

我希望使用来加速KNN搜索，但我不清楚如何将数据格式化为1)- -创建树和2) --使用树来加快搜索速度。为了详细说明，我有一个关于Netflix培训数据的熊猫数据，该数据由用户列、每一部电影的评分以及他们给它的评分组成(见下文)。使用这些培训数据，我现在通过计算测试用户的最近邻居(KNN)来预测测试用户的评分。最近邻是用Pearson的相关系数而不是欧几里得距离来计算的。一旦计算出最近的邻居，我希望使用最近的邻居来预测/猜测测试用户的评分。然而，我的用户和电影列表很大(netflix数据)，计算数千部电影中数千名用户的最近邻居在计算上是不可行的。Kd-树方法被认为是加速K近邻的一种方法.

浏览 9提问于2017-11-02得票数 1

回答已采纳

1回答

如何进行特征聚类？

machine-learning

我有不同的数据集，我想找出这些数据集之间的相似特性。数据集大小不一。例如: dataset1有列a，b，c，d，e，dataset2有列m，n，o，p，q，我们作为人，如何看待列a类似于m，c类似于n，e类似于q，但如何从ML实现这一点呢？

浏览 0提问于2022-06-26得票数 1

1回答

搜索数百万模糊散列的最佳方法

lucene、levenshtein-distance、fuzzy-search、fuzzy-comparison

我在数据库表中有大约1,000万个文件的复合散列，我希望找到彼此相当相似的文件。Spamsum散列由两个最大64字节的CTPH散列组成，它们如下所示： 384:w2mhnFnJF47jDnunEk3SlbJJ+SGfOypAYJwsn3gdqymefD4kkAGxqCfOTPi0ND:wemfOGxqCfOTPi0ND 它们可以分成三个部分(分拆冒号上的字符串)：块大小:上面哈希中的384 第一个签名：w2mhnFnJF47jDnunEk3SlbJJ+SGfOypAYJwsn3gdqymefD4kkAGxqCfOTPi0ND 第二签名：wemfOGxqCfOTPi0ND

浏览 4提问于2015-06-01得票数 6

1回答

通过比较两个文件的哈希值，还可以检索到哪些其他数据？

hash、cryptography、cryptographic-hash-function

我知道像md5这样的散列函数可以用来判断两个文件(或数据集)是否相似。即使改变一个位也会改变任何文件的哈希值。除了这些信息之外，当比较两个哈希函数时，是否还有其他信息，如两个文件的不同程度或更改的位置。有没有什么散列函数可以用来获取这些信息

浏览 3提问于2014-12-03得票数 0

3回答

在Python中，如何计算两个数据数组之间的相关性和统计显著性？

python、numpy、statistics、scipy、correlation

我用Python编程，并安装了scipy和numpy。我查找并找到了，但它似乎希望对数据进行操作，使其落入指定的范围。我假设，让scipy或numpy给我两个数组的相关性和统计意义的正确方法是什么？

浏览 0提问于2012-06-20得票数 9

4回答

图同构启发式解

algorithm、graph、heuristics、isomorphism

我正在尝试实现一个启发式解决方案来从给定的图集中识别同构图类。目前，我正在使用相邻节点的度数的多集合来标记每个节点(WL算法)。对于度规则图等情况，这显然会产生假阳性。我希望找到另一种廉价的可实现(时间和空间受限)的启发式算法，它可以绕过WL算法的角落情况。本质上，我正在寻找一对容易实现的启发式方法，它们之间会给出边缘的假阳性。除了WL算法之外，我还应该查看哪个启发式算法？谢谢!

浏览 3提问于2015-04-19得票数 4

2回答

python通用密码哈希库中的Whirlpool

python、whirlpool

在Python中有没有一些通用的(推荐的)模块来生成散列？特别是我需要whirlpool，但是像PHP中的mhash扩展或者java中的jacksum之类的东西是最理想的，因为有很多散列算法，所以它可以在将来使用。

浏览 1提问于2012-12-25得票数 2

回答已采纳

1回答

攻击者如何知道在字典攻击中使用哪种算法和salt？

hash、brute-force、password-cracking、salt、dictionary

我对密码破解方法很好奇，比如字典和暴力攻击。现在，密码是以散列形式存储的，而不是服务器上的明文。那么，如何将字典中的明文密码与泄露的数据库中的散列进行比较呢？由于哈希可以是不同的类型，如bcrypt，SHA-512等，破解工具如何知道如何创建哈希并进行比较？例如，看看下面的字典攻击。泄露的密码只是散列，字典中有简单的英文单词。那又如何比较呢？攻击者或破解工具如何知道它应该使用哪种哈希算法？就连盐也在，但攻击者怎么知道盐是什么？ 📷 📷

浏览 0提问于2018-02-26得票数 42

回答已采纳

1回答

匹配GPS坐标

google-apps-script、google-sheets、gps、match、lookup

我正在寻找一个工具，以匹配GPS坐标。附件是一张带有GPS坐标列表的工作表。我尝试了数组，但我不能从一列中减去1个单元格，即使我这样做了，它也需要一个非常长的方法。你有什么建议我可以用的吗？我希望的理想情况是，它可以检查坐标列表，并突出显示存在多次的坐标，比如300米内的坐标。我使用这个公式来计算两点之间的距离= 111*SQRT((X1-X2)^2+(Y1-Y2)^2) GPS坐标的每一次变化，对应于地理尺度上的111公里。

浏览 0提问于2020-04-01得票数 1

2回答

如何使用sklearn k-means聚类根据要素之间的相关性对要素进行聚类

python、machine-learning、scikit-learn、k-means、sklearn-pandas

我有一个pandas数据框架，其中行作为记录(患者)，105列作为特征。(每个患者的属性) 我希望聚类，不是患者，也不是通常的行，而是列，这样我就可以看到哪些特征与其他哪些特征相似或相关。我已经可以使用df.corr()计算每个特征与其他每个特征的相关性。但是我如何将这些内容集群到k=2，3，4中……使用sklearn.cluster.KMeans的组我尝试了KMeans(n_clusters=2).fit(df.T)，它确实对特征进行了聚类(因为我采用了矩阵的转置)，但只使用了欧几里得距离函数，而不是根据它们的相关性。我更喜欢根据相关性对特征进行聚类。这应该很容易，但我会感谢你的帮助。

浏览 1提问于2018-10-03得票数 1

1回答

如何获得4个列表之间相关性的t统计量和p值

python、t-test、pearson-correlation

我的目标是计算t-统计数据和p-值，以便进行以下比较：计算了两个列表之间的Periphery_T)The、Core_T、Periphery_R、Core_R四个数据列表，分别是:关联Core_R和Core_T；关联Periphery_R和Core_T结果是两个相关值。我想回答的问题是，如果相关值(核心值和外围值)是否通过显示对应的t统计量和p值来进行比较，则是否存在显着性差异。这是我的代码： import numpy as np import scipy as sp from scipy import stats Core_R = [0.472202, 0.685151, 0.2876

浏览 9提问于2022-01-29得票数 1

1回答

生成图边的有效算法

algorithm、graph-theory、graph-algorithm

给出了一组尺寸为N的三维空间坐标和最大连接距离d的顶点集合，是否有一种有效的算法来寻找距离小于d的顶点的所有无向边；不考虑环。一种简单的方法就是在所有可能的对上循环，需要N(N-1)/2距离计算.是否有一种现有的算法来寻找复杂度小于O(N^2)的所有可能的边？

浏览 3提问于2021-10-19得票数 2

回答已采纳

1回答

如何测量域自适应/Transfer学习技术的性能？

machine-learning、transfer-learning、domain-adaptation

假设您所达到的性能取决于目标离源域有多远，您如何判断算法的性能？

浏览 0提问于2019-04-11得票数 0

回答已采纳

3回答

python <=> c++跨语言哈希

c++、python、hash

我正在编写一个python程序来查找文件。该文件是由文件名( std::hash<std::string> hash_fn )为散列的C++程序创建的。我知道从中创建散列的字符串，但是我找不到一个能产生相同散列的python散列函数(我尝试了hash()和hashlib中的所有散列函数)。例如，字符串 file:///home/ubuntu/Untitled.skp 应该给出散列： 3133433022 不幸的是，我无法控制C++程序，只能控制python脚本(或最终的python扩展)。是否有可能找到或实现与C++使用的相同的散列函数？或者我应该尝试另一种方法？

浏览 3提问于2012-09-27得票数 4

回答已采纳

1回答

黑客有没有可能解密ASP.NET会员密码？

asp.net-membership、password-encryption

我正在使用默认的ASP.NET提供程序和默认的web.config设置实现SQL成员资格。我注意到密码是散列的。但我不知道asp.net是如何散列我的密码的，所以我不确定黑客是否有可能解密它？如果asp.net使用相同的规则来散列密码，这是众所周知的。黑客可以轻易地破解它。例如。如果asp.net使用MD5(123456)，其结果是"E10ADC3949BA59ABBE56E057F20F883E"，则黑客可能有一个MD5字典来查找此信息。我的设置是： <add name="AspNetSqlMembershipProvider" type=

浏览 0提问于2012-07-27得票数 4

回答已采纳

2回答

perl如何解决散列中可能发生的哈希冲突？

perl、hashmap

如我们所知，perl将其“散列”类型实现为具有计算索引的表，其中这些索引是截断散列。正如我们所知道的，散列函数可以(并且在概率上)发生碰撞，给两个或更多不同的输入提供相同的哈希。然后：当发现一个键生成与另一个键相同的哈希时，perl解释器如何处理？它能处理吗？注意事项：这不是关于散列算法，而是关于哈希表实现中的冲突解析。

浏览 1提问于2018-06-12得票数 1

回答已采纳

3回答

MD5、口令散列和盐位置

php、hash、md5、salt

在我开始之前，我知道MD5已经被攻破(碰撞攻击和散列速度)，不应该用来散列密码，但为了它，请容忍我。我的问题是:使用md5进行散列时，盐的位置如何影响散列的“质量”或“强度”？假设我有下面这段代码，它使用用户电子邮件地址的一部分作为盐来散列用户密码： <?php $email = 'user@emailservice.ex'; $password = 'RandomPassWithChars'; $segments = explode('@', $email); list($saltPart1, $sa

浏览 0提问于2012-06-20得票数 2

回答已采纳

1回答

什么是“范围”和“半径”查询，它们之间有什么区别？

redis

在为我们的应用程序寻找简单有效的工具以提高数据获取性能的同时，我们遇到了"Redis“。在redis的文档中，特别提到了这两种类型或类别的查询：它支持数据结构，如字符串、散列、列表、集合、带范围查询的排序集、位图、加长日志和具有radius查询的地理空间索引. 这是我第一次在数据库和数据结构方面读到这样的东西。我挖出互联网了解更多，但没有发现任何有用的东西。范围和半径查询究竟是什么？这两者有什么区别呢？任何有例子的解释都是有用的。

浏览 0提问于2017-07-29得票数 5

回答已采纳

1回答

如何最大化集合中最近点之间的距离？

algorithm、computational-geometry

我有一组2D点：(x1，y1)…(xn，yn)。我喜欢将这些点分成两个集合，这样每个集合中最接近的一对点就会最大化。有没有解决这个问题的算法？澄清:最大化每个集合中最接近的点对(两者都在同一集合中)。所以它不是k-means (最小化离集群中心最远的点)。

浏览 38提问于2021-09-29得票数 2

回答已采纳

1回答

自己的Hash实现

java、security、hash、hashmap

我正在尝试学习更多关于密码散列的知识。我非常习惯java，并且正在尝试为密码编写自己的散列函数。我知道你永远不应该实现你自己的密码安全，这纯粹是学术上的努力。我已经实现了自己的HashMap和其他数据结构。如果需要，我希望能描述一下哈希是如何工作的，并提供代码片段。我已经搜索了答案，但我所能找到的就是如何使用SHA256(或其他)来散列密码。我想让我自己学习更多关于算法的知识。感谢您的帮助。附注：为了澄清，我知道你可以在java中导入一些算法来散列密码。我正在寻找这些函数如何工作的描述，以及它们如何与hashMap相似，以便我可以尝试复制它。

浏览 2提问于2017-11-11得票数 0

1回答