
github地址:https://github.com/siimon/prom-client
(此文为尚不熟悉时所译,如有错误烦请指出修改)
Readme:
这是一个支持histogram, summaries, gauges and counters四种数值格式的prometheus nodejs客户端。
在example文件夹中有用法示例。这个库不会绑定任何web框架,只会在registry中返回metrics()函数来显示metrics。
nodejs的cluster模式产生了多进程并且不会干涉socket连接其他workers。从一个worker的本地registry返回metrics只会显示那个worker自己的metrics,这一般是不可取的。为了解决这点,你可以在主进程合并所有worker的metrics。查看example/cluster.js获取示例。
默认的metrics使用合理的聚合方法。自定义metrics默认会按照workers求和。要使用不同的合并方法,需要在metric配置中设置aggregator属性为'sum', 'first', 'min', 'max', 'average' or 'omit'的其中一个。(查看lib/metrics/version.js获取示例。)
如果你想要显示一个worker的metrics,可以包含一个只属于这个worker的值(比如worker ID或者进程ID)在标签中。(查看example/server.js获取使用worker_${cluster.worker.id}作为标签值的示例。)
metrics默认会通过全局registry来聚合。要使用不同的registry,就在worker进程中调用client.AggregatorRegistry.setRegistries(registryOrArrayOfRegistries)。
所有的metrics类型都有两个强制的参数:name和help。
有一些Prometheus自身推荐的默认metrics。要采集这些,就调用collectDefaultMetrics
注意:有些metrics,关于文件描述符和内存的,只在Linux可获取。
此外,包含了一些node特有的metrics,比如事件循环滞后( event loop lag),active handles和nodejs版本。在 lib/metrics 查看有哪些metrics。
collectDefaultMetrics 获取一个有三个条目的选项对象,一个指定探测多久执行一次的timeout参数,一个表示metric名称的可选前缀和一个表示哪个metrics需要被注册的注册器。默认为每10秒探测一次,但这可以像这样修改:
const client = require('prom-client');
const collectDefaultMetrics = client.collectDefaultMetrics;
// Probe every 5th second.
collectDefaultMetrics({ timeout: 5000 });注册metrics到其他注册器,传递一个注册器进来:
const client = require('prom-client');
const collectDefaultMetrics = client.collectDefaultMetrics;
const Registry = client.Registry;
const register = new Registry();
collectDefaultMetrics({ register });传入一个前缀来以任意字符串作为metrics前缀名:
const client = require('prom-client');
const collectDefaultMetrics = client.collectDefaultMetrics;
// Probe every 5th second.
collectDefaultMetrics({ prefix: 'my_application_' });你可以通过检查client.collectDefaultMetrics.metricsList来获取metrcis的所有条目。
collectDefaultMetrics 会在调用时返回一个身份标识,这是一个依赖于Timer的,用来保持探测进行。要停止所有的探测,可以传入clearInterval 。
注意:现有的间隔会在调用collectDefaultMetrics时自动清除。
const client = require('prom-client');
const collectDefaultMetrics = client.collectDefaultMetrics;
const interval = collectDefaultMetrics();
// ... some time later
clearInterval(interval);注意:unref 会在interval 内部调用,所以它不会在作为唯一保持避免停止的程序时保持你的node进程运行。
停止轮询默认metrics
要停止采集默认metrics,你需要调用调用函数并传给clearInterval。
const client = require('prom-client');
clearInterval(client.collectDefaultMetrics());
// Clear the register
client.register.clear();Counter会持续增长,并在进程重启时重置。
const client = require('prom-client');
const counter = new client.Counter({
  name: 'metric_name',
  help: 'metric_help'
});
counter.inc(); // Inc with 1
counter.inc(10); // Inc with 10Gauge类似Counter,但Gauge值可以减少。
const client = require('prom-client');
const gauge = new client.Gauge({ name: 'metric_name', help: 'metric_help' });
gauge.set(10); // Set to 10
gauge.inc(); // Inc with 1
gauge.inc(10); // Inc with 10
gauge.dec(); // Dec with 1
gauge.dec(10); // Dec with 10有一些公用的工具案例:
gauge.setToCurrentTime(); // Sets value to current time
const end = gauge.startTimer();
xhrRequest(function(err, res) {
  end(); // Sets value to xhrRequests duration in seconds
});Histogram追踪事件的尺寸和频率
配置
默认的桶用来覆盖常规的web/rpc请求,但这可以被覆写。
const client = require('prom-client');
new client.Histogram({
  name: 'metric_name',
  help: 'metric_help',
  buckets: [0.1, 5, 15, 50, 100, 500]
});你也可以包含所有的标签名作为属性。
const client = require('prom-client');
new client.Histogram({
  name: 'metric_name',
  help: 'metric_help',
  labelNames: ['status_code'],
  buckets: [0.1, 5, 15, 50, 100, 500]
});示例
const client = require('prom-client');
const histogram = new client.Histogram({
  name: 'metric_name',
  help: 'metric_help'
});
histogram.observe(10); // Observe value in histogram观察请求时间的工具
const end = histogram.startTimer();
xhrRequest(function(err, res) {
  end(); // Observes the value to xhrRequests duration in seconds
});Summary用来计算观察值的百分数。
配置 默认百分数为0.01, 0.05, 0.5, 0.9, 0.95, 0.99, 0.999。但他们可以这样改写:
const client = require('prom-client');
new client.Summary({
  name: 'metric_name',
  help: 'metric_help',
  percentiles: [0.01, 0.1, 0.9, 0.99]
});为了确保summary的滑动窗口功能,你需要像这样在配置中添加maxAgeSeconds 和ageBuckets :
const client = require('prom-client');
new client.Summary({
  name: 'metric_name',
  help: 'metric_help',
  maxAgeSeconds: 600,
  ageBuckets: 5
});maxAgeSeconds会指定一个bucket多久之后会重置,ageBuckets指定在我们的summary滑动窗口中有多少buckets。
使用示例:
const client = require('prom-client');
const summary = new client.Summary({
  name: 'metric_name',
  help: 'metric_help'
});
summary.observe(10);用来观察请求周期:
const end = summary.startTimer();
xhrRequest(function(err, res) {
  end(); // Observes the value to xhrRequests duration in seconds
});所有的metrics都可以在配置对象中设置一个标签名属性。所有metric支持的标签名都需要在这申明。有两个方法来添加标签:
const client = require('prom-client');
const gauge = new client.Gauge({
  name: 'metric_name',
  help: 'metric_help',
  labelNames: ['method', 'statusCode']
});
gauge.set({ method: 'GET', statusCode: '200' }, 100); // 1st version, Set value 100 with method set to GET and statusCode to 200
gauge.labels('GET', '200').set(100); // 2nd version, Same as above也可能通过标签使用计时器,在即使前前后都会创建:
const end = startTimer({ method: 'GET' }); // Set method to GET, we don't know statusCode yet
xhrRequest(function(err, res) {
  if (err) {
    end({ statusCode: '500' }); // Sets value to xhrRequest duration in seconds with statusCode 500
  } else {
    end({ statusCode: '200' }); // Sets value to xhrRequest duration in seconds with statusCode 200
  }
});默认标签(按注册器分割) 静态的标签可能应用于一个注册器下的每个metric:
const client = require('prom-client');
const defaultLabels = { serviceName: 'api-v1' };
client.register.setDefaultLabels(defaultLabels);这会按下面的方式输出所有metrics:
# HELP process_resident_memory_bytes Resident memory size in bytes.
# TYPE process_resident_memory_bytes gauge
process_resident_memory_bytes{serviceName="api-v1"} 33853440 1498510040309默认标签的名称如果重复了,会被覆写。
register.clear()会清除默认标签。
Counter和Gauge metrics可以在值参数后接收一个时间戳参数。这个参数必须是一个Date或者一个数字(milliseconds since Unix epoch, i.e. 1970-01-01 00:00:00 UTC,不计跳跃秒数)。
gauge.set(100, 1485531442231); // Set gauge value and timestamp as milliseconds since Unix epoch
gauge.set(100, Date.now()); // Set gauge value and timestamp as milliseconds since Unix epoch
gauge.set(100, new Date()); // Set gauge value and timestamp as Date
gauge.set({ method: 'GET', statusCode: '200' }, 100, new Date()); // Set gauge value and timestamp with labels
gauge.labels('GET', '200').set(100, new Date()); // Same as above
counter.inc(1, new Date()); // Increment counter with timestamp默认情况下,metrics是自动注册到全局注册器(require('prom-client').register)的。你可以在创建metric时通过设置最后一个参数为false(依赖于metric,这可能是第四或第五个参数)来避免这样做。
使用非全局注册器需要创建注册器实例并添加它到配置对象的registers中。或者你可以传入一个空registers数组并手动去注册它。
注册器有一个merge函数可以用来在同一个端点暴露多个注册器。如果同一个metric名在不同注册器中存在,会抛出一个错误。
const client = require('prom-client');
const registry = new client.Registry();
const counter = new client.Counter({
  name: 'metric_name',
  help: 'metric_help',
  registers: [registry]
});
const histogram = new client.Histogram({
  name: 'metric_name',
  help: 'metric_help',
  registers: []
});
registry.registerMetric(histogram);
counter.inc();
const mergedRegistries = client.Registry.merge([registry, client.register]);如果你想要在nodejs cluster模式下使用多个或非默认注册器,需要设置注册器合并:
const AggregatorRegistry = client.AggregatorRegistry;
AggregatorRegistry.setRegistries(registry);
// or for multiple registries:
AggregatorRegistry.setRegistries([registry1, registry2]);你可以通过运行register.metrics()获取所有的metrics,这会输出一个字符串给prometheus。
register.metrics()接受一个时间戳范围的可选对象。将之设为false会将字符串的时间戳去除。
获取单个metric供prometheus展示
如果你需要输出单个metric给prometheus,可以使用register.getSingleMetricAsString(name of metric),这会输出一个字符串给prometheus。
获取单个metric
如果你需要获取一个之前注册的metric,可以使用register.getSingleMetric(name of metric)。
移除metrics
你可以调用register.clear()移除所有metrics。还可以调用register.removeSingleMetric(name of metric)移除单个metric。
重置metrics 如果你需要重置所有metrics,可以使用register.resetMetrics()。这些metrics会保留在注册器中,并无需再次实例化它们就能使用,但在register.clear()之后你需要实例化。
Cluster metrics
你可以在nodejs cluster中通过register.clusterMetrics()获取所有workers的聚合metrics。该方法返回一个promise并接收一个callback,这两者都解决一个适合传给prometheus的metrics字符串。
register
  .clusterMetrics()
  .then(metrics => {
    /* ... */
  })
  .catch(err => {
    /* ... */
  });
// - or -
register.clusterMetrics((err, metrics) => {
  // ...
});可以通过Pushgateway来push metrics。
注意时间戳会在metrics被push前被剥夺,因为Pushgateway >= 0.4 将不接受时间戳。
const client = require('prom-client');
let gateway = new client.Pushgateway('http://127.0.0.1:9091');
gateway.pushAdd({ jobName: 'test' }, function(err, resp, body) {}); //Add metric and overwrite old ones
gateway.push({ jobName: 'test' }, function(err, resp, body) {}); //Overwrite all metrics (use PUT)
gateway.delete({ jobName: 'test' }, function(err, resp, body) {}); //Delete all metrics for jobName
//All gateway requests can have groupings on it
gateway.pushAdd({ jobName: 'test', groupings: { key: 'value' } }, function(
  err,
  resp,
  body
) {});
//It's possible to extend the Pushgateway with request options from nodes core http/https library
gateway = new client.Pushgateway('http://127.0.0.1:9091', { timeout: 5000 }); //Set the request timeout to 5000ms为了方便,有两个桶生成器函数——线性和指数的。
const client = require('prom-client');
new client.Histogram({
  name: 'metric_name',
  help: 'metric_help',
  buckets: client.linearBuckets(0, 10, 20) //Create 20 buckets, starting on 0 and a width of 10
});
new client.Histogram({
  name: 'metric_name',
  help: 'metric_help',
  buckets: client.exponentialBuckets(1, 2, 5) //Create 5 buckets, starting on 1 and with a factor of 2
});在注册器和本工程的主文件中,prometheus期待的内类类型都是作为常量输出的,称为contentType。