首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >Regex捕获IP中的坏八进制

Regex捕获IP中的坏八进制
EN

Stack Overflow用户
提问于 2022-03-05 19:33:17
回答 2查看 124关注 0票数 2

嗨,有人能解释一下,如果01或001没有被这个正则表达式捕获,为什么IP的最后一个八进制?

代码语言:javascript
运行
复制
(\.?)([2-9][5-9][6-9]|[3-9][0-9][0-9]|0[0-9][0-9]?)($|\.)

Debuggex Demo

作为代码的示例

代码语言:javascript
运行
复制
badOctedIPv4 := "(\\.?)([2-9][5-9][6-9]|[3-9][0-9][0-9]|0[0-9][0-9]?)($|\\.)"
ipv4Format := badOctedIPv4
matchMe := regexp.MustCompile(ipv4Format)
return matchMe.FindString(input)

输入数据如下所示:

代码语言:javascript
运行
复制
10.185.248.71 - - [09/Jan/2015:19:12:06 +0000] 808840 "GET /inventoryService/inventory/purchaseItem?userId=20253471&itemId=23434300 HTTP/1.1" 500 17 "-" "Apache-HttpClient/4.2.6 (java 1.5)"
[Thu Mar 13 19:04:13 2014] [error] [client 50.0.134.125] File does not exist: /var/www/favicon.ico
192.168.000.254 - - [13/Sep/2006:07:01:51 -0700] "PROPFIND /svn/[xxxx]/[xxxx]/trunk HTTP/1.1" 401 587 10 bad
092.168.000.254 - - [13/Sep/2006:07:01:51 -0700] "PROPFIND /svn/[xxxx]/[xxxx]/trunk HTTP/1.1" 401 587 9 bad
123.234.345.001 - - [13/Sep/2006:07:01:51 -0700] "PROPFIND /svn/[xxxx]/[xxxx]/trunk HTTP/1.1" 401 587 8 bad
123.234.145.001 - - [13/Sep/2006:07:01:51 -0700] "PROPFIND /svn/[xxxx]/[xxxx]/trunk HTTP/1.1" 401 587 7 bad
345.234.123.1 - - [13/Sep/2006:07:01:51 -0700] "PROPFIND /svn/[xxxx]/[xxxx]/trunk HTTP/1.1" 401 587 6 bad
092.168.72.177 - - [22/Dec/2002:23:32:14 -0400] "GET /favicon.ico HTTP/1.1" 404 1997 www.yahoo.com "-" "Mozilla/5.0 (Windows; U; Windows NT 5.1; rv:1.7.3)..." "-" 5 bad
123.234.145.001 - - 4 bad
123.234.145.01 - - 3 bad
123.234.05.100 - - 2 bad
123.234.005.100 - - 1 bad
123.234.5.100 - - Last entry

上述代码返回的结果仅查找所有错误的IP octets,但最后一个001或01除外。

程序的输出:

代码语言:javascript
运行
复制
❯ go run ./findInvalidIPv4.go logfile.log
[192.168.000.254] : [.000.] : 192.168.000.254 - - [13/Sep/2006:07:01:51 -0700] "PROPFIND /svn/[xxxx]/[xxxx]/trunk HTTP/1.1" 401 587 10 bad
[092.168.000.254] : [ 092.] : 092.168.000.254 - - [13/Sep/2006:07:01:51 -0700] "PROPFIND /svn/[xxxx]/[xxxx]/trunk HTTP/1.1" 401 587 9 bad
[123.234.345.001] : [.345.] : 123.234.345.001 - - [13/Sep/2006:07:01:51 -0700] "PROPFIND /svn/[xxxx]/[xxxx]/trunk HTTP/1.1" 401 587 8 bad
[  345.234.123.1] : [ 345.] : 345.234.123.1 - - [13/Sep/2006:07:01:51 -0700] "PROPFIND /svn/[xxxx]/[xxxx]/trunk HTTP/1.1" 401 587 6 bad
[ 092.168.72.177] : [ 092.] : 092.168.72.177 - - [22/Dec/2002:23:32:14 -0400] "GET /favicon.ico HTTP/1.1" 404 1997 www.yahoo.com "-" "Mozilla/5.0 (Windows; U; Windows NT 5.1; rv:1.7.3)..." "-" 5 bad
[ 123.234.05.100] : [ .05.] : 123.234.05.100 - - 2 bad
[123.234.005.100] : [.005.] : 123.234.005.100 - - 1 bad

产出解释如下:

  • 第一列。这是一个完整的坏IP,在那里发现了坏的八进制
  • 第二列。不好的八重奏..。第一场比赛就足够了
  • 第三列是传递到上述功能的完整行。

某个人能指出我所缺少的东西,以及为什么001在结尾不匹配模式吗?

谢谢

EN

回答 2

Stack Overflow用户

回答已采纳

发布于 2022-04-29 14:47:33

@selbie再次感谢您的帮助,这里的所有建议我正在接近解决这个问题,这个regex (\.|^)([2-9][5-9][6-9]|[3-9][0-9][0-9]|0[0-9]+)似乎抓住了我几乎所有需要的东西。

代码语言:javascript
运行
复制
[  192.168.2.001] : [ .001] : 192.168.2.001 - - [28/Jul/2006:10:27:10 -0300] "GET /cgi-bin/try/ HTTP/1.0" 200 3395
[192.168.000.254] : [ .000] : 192.168.000.254 - - [13/Sep/2006:07:01:51 -0700] "PROPFIND /svn/[xxxx]/[xxxx]/trunk HTTP/1.1" 401 587 10 bad
[092.168.000.254] : [  092] : 092.168.000.254 - - [13/Sep/2006:07:01:51 -0700] "PROPFIND /svn/[xxxx]/[xxxx]/trunk HTTP/1.1" 401 587 9 bad
[123.234.345.001] : [ .345] : 123.234.345.001 - - [13/Sep/2006:07:01:51 -0700] "PROPFIND /svn/[xxxx]/[xxxx]/trunk HTTP/1.1" 401 587 8 bad
[123.234.145.001] : [ .001] : 123.234.145.001 - - [13/Sep/2006:07:01:51 -0700] "PROPFIND /svn/[xxxx]/[xxxx]/trunk HTTP/1.1" 401 587 7 bad
[  345.234.123.1] : [  345] : 345.234.123.1 - - [13/Sep/2006:07:01:51 -0700] "PROPFIND /svn/[xxxx]/[xxxx]/trunk HTTP/1.1" 401 587 6 bad
[  300.234.123.1] : [  300] : 300.234.123.1 - - [13/Sep/2006:07:01:51 -0700] "PROPFIND /svn/[xxxx]/[xxxx]/trunk HTTP/1.1" 401 587 6 bad
[300.300.300.300] : [  300] : 300.300.300.300 - - [13/Sep/2006:07:01:51 -0700] "PROPFIND /svn/[xxxx]/[xxxx]/trunk HTTP/1.1" 401 587 6 bad
[ 092.168.72.177] : [  092] : 092.168.72.177 - - [22/Dec/2002:23:32:14 -0400] "GET /favicon.ico HTTP/1.1" 404 1997 www.yahoo.com "-" "Mozilla/5.0 (Windows; U; Windows NT 5.1; rv:1.7.3)..." "-" 5 bad
[123.234.145.001] : [ .001] : 123.234.145.001 - - 4 bad
[ 123.234.145.01] : [  .01] : 123.234.145.01 - - 3 bad
[ 123.234.05.100] : [  .05] : 123.234.05.100 - - 2 bad
[123.234.005.100] : [ .005] : 123.234.005.100 - - 1 bad

它跳过200.200.200.200或100.100.100.100这样的好IP,所以为了使该模式正常工作,我现在看到的唯一情况是时间字符串,02:49:12启动字符串02等等:

代码语言:javascript
运行
复制
[      127.0.0.1] : [   02] : 02:49:12 127.0.0.1 GET / 200
[      127.0.0.1] : [   02] : 02:49:35 127.0.0.1 GET /index.html 200
[      127.0.0.1] : [   03] : 03:01:06 127.0.0.1 GET /images/sponsered.gif 304
[      127.0.0.1] : [   03] : 03:52:36 127.0.0.1 GET /search.php 200
[      127.0.0.1] : [   04] : 04:17:03 127.0.0.1 GET /admin/style.css 200
[      127.0.0.1] : [   05] : 05:04:54 127.0.0.1 GET /favicon.ico 404
[      127.0.0.1] : [   05] : 05:38:07 127.0.0.1 GET /js/ads.js 200

所以,我仍然在寻找一个答案,我在这个正则表达式中遗漏了什么。

================================

编辑 ok这似乎是做的工作,它能够找到坏的ip八位数(\.|^)([2-9][5-9][6-9]|[3-9][0-9][0-9]|0[0-9]+)([^:/-])添加了lat第三组([^:/-])以排除任何带有两位数的时间格式。

票数 0
EN

Stack Overflow用户

发布于 2022-03-05 19:58:58

最后你的第三组:

($|\.)

坚持一个点或行尾字符出现在最后的八重奏之后。对于保证有一个.的前三个八进制来说,这是可以的。但对最后一个不起作用。

简单的解决方法是将其删除或使其成为可选的:

(\.?)([2-9][5-9][6-9]|[3-9][0-9][0-9]|0[0-9][0-9]?)($|\.?)

为第3组添加一个空白:

(\.?)([2-9][5-9][6-9]|[3-9][0-9][0-9]|0[0-9][0-9]?)(\s|$|\.)

或者干脆把它移除:

(\.?)([2-9][5-9][6-9]|[3-9][0-9][0-9]|0[0-9][0-9]?)

所有这些都有问题。所以,也许这就是你真正想要的,就是将你的3位数字序列中的任何一个与一个前导点或尾随点相匹配。

\.[2-9][5-9][6-9]|\.[3-9][0-9][0-9]|\.0[0-9][0-9]|\[2-9][5-9][6-9]\.|[3-9][0-9][0-9]\.|0[0-9][0-9]\.

我们开始进入正则表达式“写一次读不再”的领域。

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/71365396

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档