1.监控的核心能力是什么? 报警的有效覆盖率、线上问题的发现能力以及如何快速定位问题。 2.安全生产的整体目标是什么? 1-5-10,1 分钟发现问题、5 分钟定位问题、10 分钟修复问题。 3.为什么多数故障不能被发现? 业务未接入监控:安全意识缺乏、基础设施并不完备 核心指标未订阅:多数页面引入 ...
分类:
其他好文 时间:
2021-04-10 12:53:14
阅读次数:
0
zabbix配置 zabbix监控配置流程详解 添加主机/主机组 添加监控项 添加触发器 添加媒介 添加收件人邮箱 配置动作 手动触发 验证 自己需要加监控 直接加 开发需要加监控 让开发人员提供获取指标的命令 运营需要加监控 要运营人员让开发人员提供获取指标的命令 类型 IP地址 操作系统 服务端 ...
分类:
其他好文 时间:
2021-04-09 13:31:09
阅读次数:
0
zabbix配置流程 针对对象不同配置 运维加监控 开发需要 提供需求,以及获取需求的指令 运营需要 通用流程 添加主机组 添加监控项 添加触发器 添加媒介 添加收件人邮箱 配置动作 手动触发(模拟问题出现) 查看界面是否提示问题 实例 环境: ip|设备 | 192.168.94.143|node ...
分类:
其他好文 时间:
2021-04-09 13:26:20
阅读次数:
0
zabbix服务端安装 环境: 主机|ip|应用 | | 服务端|192.168.23.140|基于lamp架构下部署zabbix server, zabbix agent 准备工作 //安装依赖包 [root@localhost ~]# yum -y install net-snmp-devel ...
分类:
其他好文 时间:
2021-04-08 13:51:27
阅读次数:
0
UPS是一种储能、电能转换装置,能把直流电力转为交流电,能为机房设备提供电力,作用极大,因此需要进行监测、管理,以便故障及早排查、处理。那么UPS电源远程通讯监测如何实现?会采集什么样的参数? 一、监测方式 UPS是一种智能化设备,有相关的通信协议,如果想要监测UPS,通过与厂家的协议进行对接,获取 ...
分类:
其他好文 时间:
2021-04-08 13:19:13
阅读次数:
0
部署prometheus监控端mkdir /opt/monitor/[root@zabbix ~]# tar -xf prometheus-2.25.0.linux-amd64.tar.gz -C /opt/monitor/[root@zabbix ~]# mv prometheus-2.25.0. ...
分类:
其他好文 时间:
2021-04-06 14:27:18
阅读次数:
0
DAOS 依靠大规模分布式单端口存储。因此,每个 Target 实际上都是一个单独的失败点。DAOS 通过在不同的容错域中提供 Target 间的冗余来实现数据和元数据的可用性和持久性。DAOS 内部的 Pool 和 Container 的元数据通过强一致性算法进行复制。然后,通过在内部透明地利用 ... ...
分类:
其他好文 时间:
2021-04-05 12:26:13
阅读次数:
0
脚本主要功能: 1)通过zabbix api接口采集所有监控主机ip地址; 2)通过cmdb系统(蓝鲸)接口采集所有生产主机IP地址、主机名、操作系统、电源状态; 3)以上2步返回数据对比,找出未监控主机ip地址,生成csv文件; 4)发送邮件。 脚本如下: #!/usr/bin/python #c ...
分类:
编程语言 时间:
2021-04-05 12:04:28
阅读次数:
0
我创建的item是这样的: last("192.168.64.254:IfHCOutOctets[GigabitEthernet1/0/35]")+last("192.168.64.254:IfHCOutOctets[GigabitEthernet1/0/41]")+last("192.168.64 ...
分类:
其他好文 时间:
2021-04-02 12:57:16
阅读次数:
0
在做监控的时候,有可能会发生agent挂掉,无法采取到告警的时候。 这个时候可能就无法发送告警了 # 解决方法 这个时候需要用《nodata》触发器 《nodata触发器》表达式参考 {docker container check health:net.tcp.listen[{#TCP_PORT}] ...
分类:
其他好文 时间:
2021-03-31 11:35:11
阅读次数:
0