import re
list =[]
for element in address1:
z = re.match("^\d+", element)
if z:
list.append(z.string)
get_best_fuzzy("SATYAGRAH;OPP. RAJ SUYA BUNGLOW", list)
我已经尝试了上面的代码,它为我的文本文件中的地址提供了大致的地址匹配。我怎样才能得到准确的门牌号码与大致的休息地址匹配。我的地址格式是: 1004;杰伊·希瓦大厦;靠近阿扎德社会;安巴瓦迪·艾哈迈达巴德·古吉拉特邦380015印度
印度安巴瓦迪艾哈迈达巴德古吉拉特邦380015;Jayshiva大厦;靠近阿扎德社会
甘布斯塔101号;四个灯笼;对面是好牧人教堂ANDHERI,西孟买,马哈拉施特拉邦,400053印度
101/32-B;SHREE GANESH COMPLEX VEER BLOCK;SHAKARPUR;EASE DEL HI DELHI德里110092印度
发布于 2018-12-13 16:23:47
你可以试试这个。
代码:
import re
address = ["1004; Jayshiva Tower; Near Azad Society; Ambawadi Ahmedabad Gujarat 380015 India",
"101 GAMBS TOWER; FOUR BUNGLOWS;OPPOSITE GOOD SHEPHERD CHURCH ANDHERI WEST MUMBAI Maharashtra 400053 India",
"101/32-B; SHREE GANESH COMPLEX VEER SAVARKAR BLOCK; SHAKARPUR; EASE DEL HI DELHI Delhi 110092 India"]
for i in address:
z = re.match("^([^ ;]+)", i)
print(z.group())
输出:
1004
101
101/32-B
https://stackoverflow.com/questions/53756989
复制相似问题