最近在分析线上问题,需要监控 Linux 相关指标,如果只是用命令,总是只能知道当前的值,无法记录过程。而设备不是云厂商的设备,所以没有相关监控,zabbix 有,但是没有相关权限可以看到。所以找到一些好用的监控小方案。
yum install nmon
因为是 rust 搞的,所以可能有相关依赖,需要手动处理
wget https://github.com/ClementTsang/bottom/releases/download/0.4.5/bottom_x86_64-unknown-linux-gnu.tar.gz
tar xvf bottom_x86_64-unknown-linux-gnu.tar.gz
./btm
# 如果出现以下错误需要安装 glibc
# /btm: /lib64/libc.so.6: version `GLIBC_2.18' not found (required by ./btm)
curl -O http://ftp.gnu.org/gnu/glibc/glibc-2.18.tar.gz
tar zxf glibc-2.18.tar.gz
cd glibc-2.18/
mkdir build
cd build/
../configure --prefix=/usr
make -j2
make install
./btm
# make sure you run `bash` for your shell
bash
# install Netdata directly from GitHub source
bash <(curl -Ss https://my-netdata.io/kickstart.sh)
或者直接 docker
docker run -d --name=netdata \
-p 19999:19999 \
-v netdatalib:/var/lib/netdata \
-v netdatacache:/var/cache/netdata \
-v /etc/passwd:/host/etc/passwd:ro \
-v /etc/group:/host/etc/group:ro \
-v /proc:/host/proc:ro \
-v /sys:/host/sys:ro \
-v /etc/os-release:/host/etc/os-release:ro \
--restart unless-stopped \
--cap-add SYS_PTRACE \
--security-opt apparmor=unconfined \
netdata/netdata
一个字,好看!
当前我用最后一种在线上先跑着,看看情况。
上面的监控有简单的,有复杂的,你喜欢哪一种呢?或者说你还有什么更好的方案也欢迎在下面评论。