在如何安装插件的指引中,我们知道插件是由gse_agent托管的,那要维护时具体怎么做呢?
1、插件程序位置
插件安装在gse agent的同级路径
/usr/local/gse_bkte/agent # gse agent部署目录/usr/local/gse_bkte/plugins #插件部署目录
2、插件配置文件
插件的配置文件,在plugins目录下的etc目录下,插件配置文件以“插件名称.conf"命名。
[root@VM-42-61-centos /usr/local/gse_bkte/plugins/etc]# ll total 36-rw-r--r-- 1 root root 1944 Mar 11 10:17 basereport.confd--xr--r-- 2 root root 4096 Jul 6 19:34 bkmonitorbeat -rwxr-xr-x 1 root root 8231 Jul 6 19:34 bkmonitorbeat.conf -rw-r--r-- 1 root root 638 Mar 11 10:17 bkunifylogbeat.conf -rw-r--r-- 1 root root 405 Mar 11 10:17 exceptionbeat.conf -rw-r--r-- 1 root root 72 Mar 11 10:17 gsecmdline.conf -rw-r--r-- 1 root root 585 Mar 11 10:17 processbeat.conf
3、插件如何进行启动、停止、重启或者重载
A、通过节点管理进行插件(插件)的启动、停止或重启 (推荐)
B、在服务器上进行修改 (不推荐)
在plugins的bin目录下,有reload.sh、restart.sh、start.sh、stop.sh,进行对应操作。
./restart.sh bkmonitorbeat # 重启蓝鲸监控指标插件 ./reload.sh bkmonitorbeat # 重载蓝鲸监控指标插件 # 因为gse agent的托管了插件,所以即使在机器上启动、停止进程,agent均会按照托管配置进行对应操作。 # 例如:stop掉了插件,agent又会拉起插件,即stop无法达到预期目的。 # 所以,插件的启动和停止,建议在 ”A、节点管理“上操作。 ./start.sh bkmonitorbeat # 启动蓝鲸监控指标插件 ./stop.sh bkmonitorbeat # 停止蓝鲸监控指标插件
4、插件擦程序日志查看
插件的日志是写入到/var/log/gse_bkte目录下的。
5、插件启停日志查看
插件的启停脚本中,会往/tmp/bkc.log写入日志,记录启停信息。
# tail /tmp/bkc.log20220623-141557 INFO|83|log-main stop bkmonitorbeat ...20220623-141559 INFO|75|log-main start bkmonitorbeat ...20220706-193451 INFO|96|log-main stop bkmonitorbeat ...20220706-193453 INFO|185|log-main start bkmonitorbeat ...20220706-203857 INFO|185|log-main start bkmonitorbeat ...20220706-203908 INFO|185|log-main start bkmonitorbeat ...20220706-205212 INFO|96|log-main stop bkunifylogbeat ...20220706-205214 INFO|185|log-main start bkunifylogbeat ...
6、如何限制监控采集插件的资源使用率
在 节点管理的资源配额功能如何使用中,我们知道了为了保证宿主机的稳定,可以对插件的资源使用进行限制。
采集插件本身的配置文件,如:/usr/local/gse_bkte/plugins/etc/bkmonitorbeat.conf
resource_limit: enabled: true cpu: 1 # CPU 资源限制 单位 core(float64) mem: -1 # 内存资源限制 单位 MB(int),-1 代表无限制
cpu:1 # 表示限制为1核使用。(该使用率是在多核上进行动态漂移的使用率,非物理上的单核cpu使用率)
mem:-1 # 内存限制请勿自行修改,在某些linux内核版本上,可能会引发bug,使得采集器崩溃
如何查看采集插件的资源使用率
在gse agent的etc目录(/usr/local/gse_bkte/agent/etc)下,可以看到proinfo.json配置文件。
{ "procName" : "bkmonitorbeat", "cpulmt" : 10, "memlmt" : 10, ...... }
cpulmt:该插件的cpu最高资源使用率。默认10,表示该插件运行最高占用主机的10%的cpu资源时,gse agent会kill掉该采集器。
memlmt:该插件的内存最高最高资源使用率。默认10,表示该插件运行最高占用主机的10%的内存资源,gse agent会kill掉该采集器。
Ps:因为gse agent对托管文件proinfo.json的保护机制,当采集器重启后,对应的采集器托管配置会重置为默认值,所以手动修改服务器配置文件只是临时方案,长效方案建议在节点管理进行配置。