我正在做临床消息规范化(拼写检查),我根据900,000个单词的医学字典检查每个给定的单词。我更关心的是时间复杂度/性能。
我想做模糊字符串比较,但是我不确定使用哪个库。
选项1:
import Levenshtein
Levenshtein.ratio('hello world', 'hello')
Result: 0.625
选项2:
import difflib
difflib.SequenceMatcher(None, 'hello world', 'hello').ratio()
Result: 0.625
在本例中,两者给出了相同的答案。你认为两者在这种情况下的表现是一样的吗?
https://stackoverflow.com/questions/6690739
复制相似问题