我有:
第二个数字相似,但不等于第一个数字。这两个数字都是有效的。
我想计算第二个数字实际上是第一个数字的输入错误的可能性。
这些错误可能包括:
有人知道这种算法/代码的存在吗?
编辑:
我不是在找一般的字符串相似算法。我正在寻找一个算法优化的人为数字输入错误,或一些关于这个主题的研究。
发布于 2011-03-14 08:35:47
有几个度量字符串相似度的算法。
您可以实现Levenshtein距离或Damerau-Levenshtein距离的一些变体,它可以对错误类型进行不同的评估。
发布于 2011-03-14 08:56:48
将这些数字看作一个数字序列,并计算出两个数字之间的相似度。2.0*M / T.
,其中T是两个数字中的数字数,M是两个数字中的匹配数
相似性比率为0.6及以上,表示这两个数字相似。
请注意,如果数字是相同的,则比率为1,如果它们没有相同的数字,则为0。
https://stackoverflow.com/questions/5296297
复制相似问题