我试图从日志文件中解析这样的文本:
2016-01-29 11:31:33,809:警告/工人-1283 1030140:::DEAL_OF_DAY:::29:::1:::11 2016-01-29 11:31:34,103:警告/工人-1197 1025311:::DEAL_OF_DAY:::29:::1:::11 2016-01-29 11:31:34,291:警告/工人-1197 1025158:::DEAL_OF_DAY:::29:::1:::11
我想提取这些数字1030140,1025311,1025158等等。
我试过以下几种方法
cat deals29.txt | egrep -o '[0-9]+'
但这也给出了其他数字
我试过了
cat deals29.txt | egrep -o ' [0-9]+:::'
但是现在它也给出了输出中的冒号,并且无法在grep的命令行版本中捕获组。
有什么建议吗?grep解决方案是首选的,但是如果grep不能完成这项工作,我也可以使用sed/awk。
发布于 2016-02-01 11:59:35
使用grep -oP和匹配重置\K
grep -oP '^\[.*?\] \K\d+' file.log
1030140
1025311
1025158如果您的grep不支持-P (PCRE),那么使用awk
awk -F '\\] |:::' '{print $2}' file.log
1030140
1025311
1025158https://stackoverflow.com/questions/35129865
复制相似问题