首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >为什么这个Java正则表达式不能一致地从美国街道地址中剥离街道编号?

为什么这个Java正则表达式不能一致地从美国街道地址中剥离街道编号?
EN

Stack Overflow用户
提问于 2010-09-14 03:44:39
回答 3查看 666关注 0票数 3

我想把邮寄地址上的街道号码去掉。

我在Java中有一个正则表达式:

代码语言:javascript
运行
复制
address.replace("^\\s*[0-9]+\\s+","");

它在这个地址上工作:

代码语言:javascript
运行
复制
301 West 23rd Street

正在制作中:

代码语言:javascript
运行
复制
West 23rd Street

但是当我将它应用于这个地址时,地址是不变的:

代码语言:javascript
运行
复制
70-50 69th Place

相反,它需要:

代码语言:javascript
运行
复制
69th Place

有什么想法吗?

EN

回答 3

Stack Overflow用户

发布于 2010-09-14 03:49:02

这个正则表达式只会去掉它遇到的第一组数字。它在-上也遇到了麻烦。如果你想去掉每一组数字,包括-s,可以这样做:

代码语言:javascript
运行
复制
address.replace("^\\s*([0-9-]+\\s+)+","");
票数 1
EN

Stack Overflow用户

发布于 2010-09-14 03:49:47

您的正则表达式要求查找:空格、数字、空格,然后不使用任何内容替换它们。

你的“坏”字符串没有空格,数字,空格,它有空格,数字,破折号。

如果您想在街道号码中包含破折号,可以尝试这样做:"^\\s*[0-9-]+\\s+"

票数 1
EN

Stack Overflow用户

发布于 2012-02-09 04:11:33

如果我可以提个建议..。通过简单地使用正则表达式来操作地址数据,就像使用一个手持钻来雕刻Mt。拉什莫尔出山了。它可能一开始看起来是有效的,但仍然有很多工作要做。

您是否考虑过以所有形式输入的地址,以及与预期不同的组件顺序?如果街道名称没有数字"th“或"st”,等等(这里列出的案例太多了)。

我在SmartyStreets工作,我们的专长是标准化和验证地址。对于您的任务,您可以挂钩到CASS认证的API,以返回标准化和组件化的地址,这样您就可以只保留您想要的部分,并且是准确的。我建议你研究一下像LiveAddress这样的东西,它免费提供了这个功能。你自己做一些研究吧,我很乐意帮助你回答其他与地址相关的问题。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/3703832

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档