首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >我解不出正则表达式,我不知道什么是问题

我解不出正则表达式,我不知道什么是问题
EN

Stack Overflow用户
提问于 2019-11-29 02:52:02
回答 3查看 113关注 0票数 1

我正在尝试编写一段代码,使用正则表达式来检查ipv4地址是否正确,但我似乎找不出问题所在。

代码语言:javascript
运行
复制
import re
pattern=re.compile('([0-9]|[1-9][0-9]|1[0-9]{2}|2[0-4][0-9]|25[0-5]\.){3}([0-9]|[1-9][0-9]|1[0-9][0-9]|2[0-4][0-9]|25[0-5])')
ip=['17.255.16.45','255.255.255.255','0.0.0.0','0.14.255.14','2555.2564.0.3','0.3.255']

for i in range (len(ip)):
    if re.search(pattern,ip[i]):
        print(ip[i],'ok')
    else:
        print(ip[i],"nope")
EN

回答 3

Stack Overflow用户

发布于 2019-11-29 03:10:00

我认为问题是您的\.包含在备选方案中,而它应该总是包含在它之前的任何选项之后。您可以通过将这些选项放在一对括号中来修复它。此外,建议对正则表达式使用raw strings,以避免转义问题。

代码语言:javascript
运行
复制
import re
pattern=re.compile(r'(([0-9]|[1-9][0-9]|1[0-9]{2}|2[0-4][0-9]|25[0-5])\.){3}([0-9]|[1-9][0-9]|1[0-9][0-9]|2[0-4][0-9]|25[0-5])')
ip=['17.255.16.45','255.255.255.255','0.0.0.0','0.14.255.14','2555.2564.0.3','0.3.255']

for i in range (len(ip)):
    if re.search(pattern,ip[i]):
        print(ip[i],'ok')
    else:
        print(ip[i],"nope")

输出:

代码语言:javascript
运行
复制
17.255.16.45 ok
255.255.255.255 ok
0.0.0.0 ok
0.14.255.14 ok
2555.2564.0.3 nope
0.3.255 nope
票数 0
EN

Stack Overflow用户

发布于 2019-11-29 03:17:11

我甚至不知道哪里出了问题,但只要我把它重构到这里,它似乎就起作用了:

代码语言:javascript
运行
复制
import re

ip_num_pat = r"[0-9]|[1-9][0-9]|1[0-9]{2}|2[0-4][0-9]|25[0-5]"

pattern = re.compile(r'(?:({0})\.){{3}}({0})'.format(ip_num_pat))
ip_addrs = [
    '17.255.16.45', '255.255.255.255', '0.0.0.0', '0.14.255.14',
    '2555.2564.0.3', '0.3.255']

for ip in ip_addrs:
    if pattern.match(ip):
        print(ip, 'ok')
    else:
        print(ip, 'nope')

通常,通过将它们拆分成较小的部分,可以更容易地跟踪这些事情。我想最后一块可能是错的。

另外,请注意,我已经将您的代码从.search改为使用.match,。这一点至关重要,因为否则您将匹配像01.2.3.4这样的东西。

但是,正如其他人所说,一种更简单的方法看起来像这样:

代码语言:javascript
运行
复制
ip_addrs = [
    '17.255.16.45', '255.255.255.255', '0.0.0.0', '0.14.255.14',
    '2555.2564.0.3', '0.3.255', '03.1.2.3']

def is_ip(addr):
    try:
        component_strings = addr.split(".")
        if any(i.startswith("0") and i != "0" for i in component_strings):
            raise ValueError("Components cannot start with 0")
        components = [int(i) for i in component_strings]
        if len(components) != 4:
            raise ValueError("Need 4 parts for an IPv4 address")
        if any(not 0 <= i < 256 for i in components):
            raise ValueError("Components should be in range 0, ..., 255")
        return True
    except ValueError:
        return False

for ip in ip_addrs:
    if is_ip(ip):
        print(ip, 'ok')
    else:
        print(ip, 'nope')
票数 0
EN

Stack Overflow用户

发布于 2019-11-29 03:32:24

虽然在regexp上工作对于教育目的来说可能很有趣,但如果打算将其转化为实际代码,最好使用Python的ipaddress模块-而不是重复发明轮子。

它是part of Python standard library since Python 3.3,使用它所需要做的就是:

代码语言:javascript
运行
复制
import ipaddress

# The "for ... in range(len(...))" pattern is not really needed in Python
# the native for can walk your sequence elements:
for address in ip:
    try:
       ipaddress.ip_address(address)
    except ValueError:
       print(address, "Nope")
    else:
       print (adress, "ok")

除了正则表达式中的细微错误之外,明显的优势是它还可以解析IPv6地址(如果不需要这些地址,可以很容易地在.version属性中检查协议)-上面的ip_address调用返回一个对象,该对象免费提供有关IP的大量信息,而不需要任何额外的工作,包括但不限于:

代码语言:javascript
运行
复制
 'is_link_local',
 'is_loopback',
 'is_multicast',
 'is_private',
 'is_reserved',
 'is_unspecified',
 'max_prefixlen',
票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/59094836

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档