码迷,mamicode.com
首页 > 其他好文 > 详细

k8s node alertmanager监控报警配置方法

时间:2018-09-18 20:51:14      阅读:702      评论:0      收藏:0      [点我收藏+]

标签:mod   manage   max   fst   rate   cpu   files   rom   磁盘io   

概述

节点本身的监控主要监控CPU、内存、磁盘IO、文件系统可用空间即可。
比如,对于使用来prometheus的alertmanager来做node报警,rules配置可以参考如下点进行配置即可。

说明

不同的node-exporter版本,对应的metrics也不一样,需要自己对照更改一下。

CPU监控

(1 - avg(irate(node_cpu{mode="idle"}[10m])) by (instance)) * 100 < 90

内存监控

((node_memory_MemTotal - node_memory_MemFree) / node_memory_MemTotal) * 100 < 90

磁盘IO监控

(max(avg(irate(node_disk_io_time_ms[10m])) by (instance, device)) by (instance))/10

文件系统可用空间监控

max(((node_filesystem_size{fstype=~"ext4|vfat"} - node_filesystem_free{fstype=~"ext4|vfat"}) / node_filesystem_size{fstype=~"ext4|vfat"}) * 100) by (instance) > 90

参考:https://www.dogsbodytechnology.com/blog/turning-prometheus-data-into-metrics-for-alerting/

k8s node alertmanager监控报警配置方法

标签:mod   manage   max   fst   rate   cpu   files   rom   磁盘io   

原文地址:http://blog.51cto.com/dangzhiqiang/2176843

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!