日志采集技术笔记

哒呵呵

发布于 2018-10-18 11:18:53

1.8K0

发布于 2018-10-18 11:18:53

文章被收录于专栏：鸿的学习笔记

目的端：具备数据订阅功能的集中存储源端：普通的文本文件，通过网络接收到的日志数据

推:日志采集Agent主动从源端取得数据后发送给目的端拉:目的端主动向日志采集Agent获取源端的数据

简而言之是对Linux下的tail -f命令的完善

定时去轮询目录。但是轮询的周期太长会导致不够实时，太短又会耗CPU。
利用Linux的Inotify的机制，让内核来监测一个目录下文件的变化，然后通过事件的方式通知agent。但是Inotify不支持递归下目录文件生成，并且不通用。
改进措施就是Inotify+轮询。定时轮询保证不会漏掉文件，Inotify保证实时性，减少CPU损耗。

使用点位文件记录文件名和对应的采集位置，那么问题又来了。

使用Linux的rename机制保证文件写入要么成功，要么失败，绝对不能出现写了一半的情况。

使用inode作为文件的标识信息，而且保证同一时刻Inode是不会重复的，但是同一设备可能会有很多文件系统，所以需要加上设备码dev，所以点位文件的记录是一个三元组(dev,inode,offset)

利用文件的扩展属性xattr，保证如果文件被删除了，然后创建一个新的文件即使Inode相同，但是文件标识也不一样。或者也可以通过文件的内容来解决这个问题，可以读取文件的前N个字节作为文件标识。

尽可能的顺序读，充分利用Linux系统缓存，必要的时候可以用posix_fadvise在采集完日志文件后清除页缓存，主动释放系统资源。

轮询去查询要采集文件的stat信息，发现文件内容有更新就采集，采集完成后再触发下一次的轮询。

已经打开的文件即使被删除也只是引用计数减1，只要有进程引用就可以继续读内容的，所以日志采集Agent可以安心的继续把日志读完，然后释放文件的fd，让系统真正的删除文件。

由于ftp客户端的不可控，所以导致FTP服务器的实时采集不同于一般的日志采集，因此agent只能够监听服务器上的文件，进而判断该文件是否写成功。

agent周期性访问FTP服务器，获取符合匹配规则文件的文件状态，过一定时间间隔（视情况而定，一般是几秒）再刷新，如果新增加的文件没有发生状态变更，则下载数据，如果是监控文件的更新，则是对比文件状态是否发生变更，找到之前记录的offset，采集更新数据。
在某些操作系统的ftp服务，在文件上传的时候，ftp服务会对此文件做加锁处理，保证该文件不被读写，但是并不通用，因此最理想的情况是由文件上传者管理，利用rename，临时文件夹等方式保证文件确实完成写入操作。

本文参与腾讯云自媒体同步曝光计划，分享自微信公众号。

原始发表：2018-09-28，如有侵权请联系 cloudcommunity@tencent.com 删除