专栏首页奕空filebeat合并多行日志示例

filebeat合并多行日志示例

译文

多行配置示例

本节中的示例包括以下内容:

  • 将Java堆栈跟踪日志组合成一个事件
  • 将C风格的日志组合成一个事件
  • 结合时间戳处理多行事件

Java堆栈跟踪

Java示例一:

Java堆栈跟踪由多行组成,每一行在初始行之后以空格开头,如本例中所述:

Exception in thread "main" java.lang.NullPointerException
        at com.example.myproject.Book.getTitle(Book.java:16)
        at com.example.myproject.Author.getBookTitles(Author.java:25)
        at com.example.myproject.Bootstrap.main(Bootstrap.java:14)

要将这些行整合到Filebeat中的单个事件中,请使用以下多行配置:

multiline.pattern: '^[[:space:]]'
multiline.negate: false
multiline.match: after

此配置将以空格开头的所有行合并到上一行。

Java示例二:

下面是一个Java堆栈跟踪日志,稍微复杂的例子:

Exception in thread "main" java.lang.IllegalStateException: A book has a null property
       at com.example.myproject.Author.getBookIds(Author.java:38)
       at com.example.myproject.Bootstrap.main(Bootstrap.java:14)
Caused by: java.lang.NullPointerException
       at com.example.myproject.Book.getId(Book.java:22)
       at com.example.myproject.Author.getBookIds(Author.java:35)
       ... 1 more

要将这些行整合到Filebeat中的单个事件中,请使用以下多行配置:

multiline.pattern: '^[[:space:]]+(at|\.{3})\b|^Caused by:'
multiline.negate: false
multiline.match: after

此配置解释如下:

  • 将以空格开头的所有行合并到上一行
  • 并把以Caused by开头的也追加到上一行

C风格的日志

一些编程语言在一行末尾使用反斜杠(\)字符,表示该行仍在继续,如本例中所示:

printf ("%10.10ld  \t %10.10ld \t %s\
  %f", w, x, y, z );

要将这些行整合到Filebeat中的单个事件中,请使用以下多行配置:

multiline.pattern: '\\$'
multiline.negate: false
multiline.match: before

此配置将以\字符结尾的任何行与后面的行合并。

时间戳 来自Elasticsearch等服务的活动日志通常以时间戳开始,然后是关于特定活动的信息,如下例所示:

[2015-08-24 11:49:14,389][INFO ][env                      ] [Letha] using [1] data paths, mounts [[/
(/dev/disk1)]], net usable_space [34.5gb], net total_space [118.9gb], types [hfs]

要将这些行整合到Filebeat中的单个事件中,请使用以下多行配置:

multiline.pattern: '^\[[0-9]{4}-[0-9]{2}-[0-9]{2}'
multiline.negate: true
multiline.match: after

此配置使用negate: truematch: after设置来指定任何不符合指定模式的行都属于上一行。

应用程序事件

有时您的应用程序日志包含以自定义标记开始和结束的事件,如以下示例:

[2015-08-24 11:49:14,389] Start new event
[2015-08-24 11:49:14,395] Content of processing something
[2015-08-24 11:49:14,399] End event

要在Filebeat中将其整合为单个事件,请使用以下多行配置:

multiline.pattern: 'Start new event'
multiline.negate: true
multiline.match: after
multiline.flush_pattern: 'End event'

此配置把指定字符串开头,指定字符串结尾的多行合并为一个事件。

译自:elastic

实践

实践所用材料 前往 码云

实践Java示例一:

日志如下,预计可得5条数据

test-a.log 开始测试,这也是个事件
Exception in thread "main" java.lang.NullPointerException 空指针test1start
        at com.example.myproject.Book.getTitle(Book.java:16)
        at com.example.myproject.Author.getBookTitles(Author.java:25)
        at com.example.myproject.Bootstrap.main(Bootstrap.java:14)
		空指针test1end
Exception in thread "main" java.lang.NullPointerException 空指针test2start
        at com.example.myproject.Book.getTitle(Book.java:16)
        at com.example.myproject.Author.getBookTitles(Author.java:25)
        at com.example.myproject.Bootstrap.main(Bootstrap.java:14)
		空指针test2end
Exception in thread "main" java.lang.NullPointerException 空指针test3start
        at com.example.myproject.Book.getTitle(Book.java:16)
        at com.example.myproject.Author.getBookTitles(Author.java:25)
        at com.example.myproject.Bootstrap.main(Bootstrap.java:14)
		空指针test3end
test-a.log 结束测试,这也是个事件

Kibana查看结果

获取了5条数据,空格的追加到上一个事件,实践成功。

实践Java示例二:这个有点坎坷,合并的一塌糊涂,大家做测试的时候最好用真实日志做正则验证,此处不赘述了。

实践时间戳:

日志如下,预计可得3条数据

时间戳开始,这个不会被抓取
[2015-08-24 11:49:14,389][INFO ][env                      ] [Letha] using [1] data paths, mounts [[/ 时间戳A-1
(/dev/disk1)]], net usable_space [34.5gb], net total_space [118.9gb], types [hfs] 时间戳A-2
[2016-08-24 11:49:14,389][INFO ][env                      ] [Letha] using [1] data paths, mounts [[/ 时间戳B-1
(/dev/disk1)]], net usable_space [34.5gb], net total_space [118.9gb], types [hfs] 时间戳B-2
[2017-08-24 11:49:14,389][INFO ][env                      ] [Letha] using [1] data paths, mounts [[/ 时间戳C-1
(/dev/disk1)]], net usable_space [34.5gb], net total_space [118.9gb], types [hfs] 时间戳C-2
时间戳结束,这个不会被抓取

Kibana查看结果

虽然也得到了3条数据,但合并的有些尴尬,看来需要抽空在补一篇正则规则了。

综上,合并没什么问题,重点在正则,做合并的时候先做做测试,看是否符合自己的预期。

真实数据测试时可以先做下数据筛选

#exclude_lines: ['^DBG']
#include_lines: ['^ERR', '^WARN']

拓展知识

filebeat和logstash的合并方式几乎无区别

input {
    file {
        path => "/var/*.log"
        codec => multiline {
            pattern => "^\[\d{2}-"
            negate => true
            what => "previous"
        }
    }
}
what确定合并属于上一个事件还是下一个事件,可以为next和previous
而filebeat对应的是multiline.match: after和before

这是一个传承的关系:

因为logstash是jvm跑的,资源消耗比较大,所以后来作者又用golang写了一个功能较少但是资源消耗也小的轻量级的logstash-forwarder。不过作者只是一个人,加入elastic以后,因为elastic本身还收购了另一个开源项目packetbeat,而这个项目专门就是用golang的,有整个团队,所以elastic干脆把logstash-forwarder的开发工作也合并到同一个golang团队来搞,于是新的项目就叫filebeat了。

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 代码中特殊的注释技术——TODO、FIXME和XXX的用处

    TODO: + 说明: 如果代码中有该标识,说明在标识处有功能代码待编写,待实现的功能在说明中会简略说明。 FIXME: + 说明: 如果代码中有该标...

    用户1409099
  • filebeat+logstash配置搭建 原

    版本:filebeat-6.0.0、logstash-6.0.0、elasticsearch-6.0.0、kibana-6.0.0

    用户1409099
  • centos7 离线安装字体fontconfig

    在线:直接 yum -y install fontconfig;yum -y install ttmkfdir;配置下即可。

    用户1409099
  • 简单易学的机器学习算法——Label Propagation

    一、社区划分的概述 对于社区,没有一个明确的定义,有很多对社区的定义,如社区是指在一个网络中,有一组节点,它们彼此都相似,而组内的节点与网络中的其他节点则不相似...

    zhaozhiyong
  • 动手学深度学习(七) 梯度下降

    致Great
  • 使用Atlas进行数据治理

    Apache Atlas为Hadoop提供了数据治理功能。Apache Atlas用作公共元数据存储,旨在在Hadoop堆栈内外交换元数据。Atlas与Apac...

    大数据杂货铺
  • 关键词与主题分面公式

    用关键词描述主题,----实际上这里是指叙词(descriptor),为了更一般化和更易懂,我还是用关键词(key word)来代替----是通行的文献分类和检...

    ruanyf
  • HT For Web 拓扑图背景设置

    HT For Web 的HTML5拓扑图组件graphView背景设置有多种途径可选择: divBackground:通过css设置graphView对应的di...

    HT for Web
  • HT For Web 拓扑图背景设置

    HT_hightopo
  • 如何为Keras中的深度学习模型建立Checkpoint

    深度学习模式可能需要几个小时,几天甚至几周的时间来训练。 如果运行意外停止,你可能就白干了。 在这篇文章中,你将会发现在使用Keras库的Python训练过程中...

    AiTechYun

扫码关注云+社区

领取腾讯云代金券

玩转腾讯云 有奖征文活动