首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >是否有令人信服的理由在Perl正则表达式中使用量词,而不是仅仅重复字符?

是否有令人信服的理由在Perl正则表达式中使用量词,而不是仅仅重复字符?
EN

Stack Overflow用户
提问于 2010-03-31 02:23:40
回答 8查看 319关注 0票数 10

我正在为一位同事执行代码审查,他有一个正则表达式,看起来像这样:

代码语言:javascript
复制
if ($value =~ /^\d\d\d\d$/) {
    #do stuff
}

我告诉他应该改成:

代码语言:javascript
复制
if ($value =~ /^\d{4}$/) {
    #do stuff
}

对于这一点,他回答说,为了可读性,他更喜欢第一种(我发现第二种更具可读性,但这是一场宗教辩论,我会留到以后再讨论)。

我的问题是:一个比另一个有实际的好处吗?

EN

回答 8

Stack Overflow用户

回答已采纳

发布于 2010-03-31 02:28:11

它们做的是完全相同的事情,所以就实用性而言,这是一个偏好问题。这样或那样的性能差异很小吗?谁知道呢,但它肯定是微不足道的。

当模式长度不固定时,量词更有用(也是必需的),例如\d{12,16}\d{2,}等。

我更喜欢比\d\d\d\d更容易被我的大脑解析的\d{4}

另外,如果你匹配的是一个字符类而不是一个简单的数字呢?[aeiouy0-9]{4}还是[aeiouy0-9][aeiouy0-9][aeiouy0-9][aeiouy0-9]

票数 12
EN

Stack Overflow用户

发布于 2010-03-31 02:37:46

没有绝对的可读性这回事。这是人们可以单独识别的,这就是为什么人们经常理解他们的代码,而其他人却不能。如果他从不使用量词,他总是会认为量词很难读懂,因为他从来不会去摸索它们。

我经常发现,当人们说“可读性更好”时,他们真正的意思是“这是我已经知道的东西”或“这是我第一次写的东西”。然而,在这里不一定是这样的。

{4}这样的绝对量词更容易指定,也更容易与其他程序员交流。谁想用手数一下\d的个数?你编写代码给其他人阅读,所以不要让他们的生活变得更困难。

但是,您可能遗漏了该代码中的bug,因为您关注的是量词问题。Perl锚点允许在字符串的末尾换行,如果出现$最佳实践狂热分子并盲目地将/xsm添加到所有正则表达式中(这是我见过很多次的痛苦经历),那么$将允许更多的无效输出。您可能希望使用\z绝对字符串结束锚点。

这不是发生在你的案例中,而是代码审查倾向于变成风格或语法审查(因为它们更容易被注意到),并且实际上错过了检查适当的和预期的行为和正确的设计的要点。通常,样式问题不值得考虑您可以花费时间来改进代码的所有其他方法。:)

票数 15
EN

Stack Overflow用户

发布于 2010-03-31 02:29:27

任何超过3或4次的重复都很难一目了然。我认为这是一个令人信服的理由。最重要的是,使用量词是一种“密集”的方式来表达重复的信息。对我来说,这就像是复制粘贴代码“重用”与编写真正可重用的代码之间的区别。

票数 5
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/2547578

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档