它们几乎都是一样的。我试图找到这些地址之间的匹配,以便我可以将它们组合在一起并对它们进行重新编码。 我尝试过使用agrep和stringdist包。使用agrep时,我不确定是否应该将每个地址作为一个模式,并将其与其他地址进行匹配。不确定是否应该从字符矢量中删除这些元素,或者将它们转换为其他格式。我试着用agrep: for (i in 1:length(nsrpattn)) {
npat <- agrep(nsrpattn[i], df$address, max=1, v=T
给定以下两个向量,是否有方法生成所需的数据帧?这代表了一个真实的情况,我必须对其进行数据帧,第一个包含带有数据库值(键)的col,第二个包含一个1000+行,每个行都是我需要匹配的文件名(潜能)。问题是可以有多个文件(潜力)匹配到任何给定的密钥。我曾与grep,合并,内部连接等一起工作,但无法将它们合并到一个解决方案中。如有任何建议,我们将不胜感激!tigerWALKINGALONE", "bearOHMY, be