我正在为一位同事执行代码审查,他有一个正则表达式,看起来像这样:
if ($value =~ /^\d\d\d\d$/) {
#do stuff
}我告诉他应该改成:
if ($value =~ /^\d{4}$/) {
#do stuff
}对于这一点,他回答说,为了可读性,他更喜欢第一种(我发现第二种更具可读性,但这是一场宗教辩论,我会留到以后再讨论)。
我的问题是:一个比另一个有实际的好处吗?
发布于 2010-03-31 02:28:11
它们做的是完全相同的事情,所以就实用性而言,这是一个偏好问题。这样或那样的性能差异很小吗?谁知道呢,但它肯定是微不足道的。
当模式长度不固定时,量词更有用(也是必需的),例如\d{12,16}、\d{2,}等。
我更喜欢比\d\d\d\d更容易被我的大脑解析的\d{4}
另外,如果你匹配的是一个字符类而不是一个简单的数字呢?[aeiouy0-9]{4}还是[aeiouy0-9][aeiouy0-9][aeiouy0-9][aeiouy0-9]?
发布于 2010-03-31 02:37:46
没有绝对的可读性这回事。这是人们可以单独识别的,这就是为什么人们经常理解他们的代码,而其他人却不能。如果他从不使用量词,他总是会认为量词很难读懂,因为他从来不会去摸索它们。
我经常发现,当人们说“可读性更好”时,他们真正的意思是“这是我已经知道的东西”或“这是我第一次写的东西”。然而,在这里不一定是这样的。
像{4}这样的绝对量词更容易指定,也更容易与其他程序员交流。谁想用手数一下\d的个数?你编写代码给其他人阅读,所以不要让他们的生活变得更困难。
但是,您可能遗漏了该代码中的bug,因为您关注的是量词问题。Perl锚点允许在字符串的末尾换行,如果出现$最佳实践狂热分子并盲目地将/xsm添加到所有正则表达式中(这是我见过很多次的痛苦经历),那么$将允许更多的无效输出。您可能希望使用\z绝对字符串结束锚点。
这不是发生在你的案例中,而是代码审查倾向于变成风格或语法审查(因为它们更容易被注意到),并且实际上错过了检查适当的和预期的行为和正确的设计的要点。通常,样式问题不值得考虑您可以花费时间来改进代码的所有其他方法。:)
发布于 2010-03-31 02:29:27
任何超过3或4次的重复都很难一目了然。我认为这是一个令人信服的理由。最重要的是,使用量词是一种“密集”的方式来表达重复的信息。对我来说,这就像是复制粘贴代码“重用”与编写真正可重用的代码之间的区别。
https://stackoverflow.com/questions/2547578
复制相似问题