我有两张桌子
df_1

df_2

有没有办法开发一个模糊匹配逻辑(在Python语言或R语言中)来从df_1的df_2中查找ID
匹配应基于模糊name匹配、精确city匹配、state匹配和zip匹配。如果在city_1中找不到匹配项,我会在city_2中查找匹配项。如果在state_1中找不到匹配项,我会在state_2中查找匹配项。df_2也是如此。如果我在NAME_1中找不到模糊名称匹配,我会去NAME_2上查找模糊匹配。
预期输出应如下所示:

发布于 2020-09-18 04:02:05
签出fuzzywuzzy库。它使用Lavenstein距离来比较匹配。如果您对结果不太满意,可以使用n gram analysis。
https://stackoverflow.com/questions/63945390
复制相似问题