今天用shell写了一个钉钉告警,但是在通过发送信息的那一步,产生一个报错:{"errcode":40035,"errmsg":"缺少参数 json"}。下面是详细的shell脚本和报警信息 #!/bin/bash source ~/.bash_profile time=$(date "+%Y-%m ...
分类:
Web程序 时间:
2020-05-08 09:31:42
阅读次数:
420
一套生产环境DB,每周日进行一次0级全备,其余每周6天都是增量备份。 但是磁盘告警,备份目录使用率>90%, 检查备份脚本是定期删除8天前的过期备份信息!!! 发现的问题: 最早的备份信息是3周前的备份信息??? 删除脚本失效了??? 1. 准备操作,手工执行清理8天前的rman备份信息。 run ...
分类:
其他好文 时间:
2020-05-07 13:33:11
阅读次数:
125
Prometheus告警简介 告警能力在Prometheus的架构中被划分成两个独立的部分。如下所示,通过在Prometheus中定义AlertRule(告警规则),Prometheus会周期性的对告警规则进行计算,如果满足告警触发条件就会向Alertmanager发送告警信息。 在Promethe ...
分类:
其他好文 时间:
2020-05-07 09:15:29
阅读次数:
64
收到zabbix告警,一台服务器上inodes使用率超过90%了,如下:【XX服务】状态:PROBLEM地址:xx.xx.xx.xx主机:xxxxxx_xx-db1时间:2020.05.0420:15:48事件:Freeinodesislessthan10%onvolume/数值:Freeinodeson/(percentage)(vfs.fs.inode[/,pfree]):10%解决方法:通过
分类:
系统相关 时间:
2020-05-07 09:13:53
阅读次数:
86
使用 命令 运行项目时,抛出警告,警告如下 原因是 或 为老项目运行方式,而我的环境为 解决办法为,使用命令 ...
分类:
其他好文 时间:
2020-05-03 21:50:11
阅读次数:
69
当下IT运维人员的一大问题,就是对于大量的告警难以进行精准的通知,以及无法在大批量的告警中快速的定位到问题的所在,再加上时不时出现的告警风暴,加大了告警处理的难度,这就需要一款完善的告警管理平台来针对告警的统一化管理。 睿象云智能告警平台Cloud Alert(简称CA)快速接入各类事件,通过人工智 ...
分类:
其他好文 时间:
2020-05-02 23:13:12
阅读次数:
89
1. 案例:一条慢SQL拖死整个系统 某天突然发现服务探测接口疯狂告警、同时数据库CPU消耗也告警,最后系统都无法访问; 起先以为服务出现问题,服务重启后现象依旧; 后检查数据库发现,大量的慢SQL正在阻塞等待执行: 查看哪些表被锁:show OPEN TABLES where In_use > 0 ...
分类:
数据库 时间:
2020-05-02 22:39:04
阅读次数:
145
运行流程 来源 https://zhuanlan.zhihu.com/p/36997098 一.微信小程序是啥 本质其实就是(混合)的app 介于web app与native 原生app之间,具备丰富的调用手机各种功能的接口,同时又具备灵活性,跨平台 1. 运行环境差异 微信小程序运行在三端:iOS ...
分类:
其他好文 时间:
2020-05-01 12:58:33
阅读次数:
163
这篇文章将承接此前关于使用Prometheus配置自定义告警规则的文章。在本文中,我们将demo安装Prometheus的过程以及配置Alertmanager,使其能够在触发告警时能发送邮件,但我们将以更简单的方式进行这一切——通过Rancher安装。 我们将在这篇文章中看到没有使用依赖项的情况下如何完成这一操作。在本文中,我们不需要: 专门配置运行指向Kubern
分类:
其他好文 时间:
2020-05-01 11:00:49
阅读次数:
76
赛题目标:分析实际生产中的网络拓扑及告警数据,设计并实现一种故障根因定位算法,准确的定位出故障根因节点(赛题的价值在于准确、快速的定位网络故障,提升一线网络运维的效率,降低网络故障产生的损失) 基本功能需求: 1.基于提供的训练数据,设计并实现故障根因定位算法 2.故障根因定位算法中要包含告警数据预 ...
分类:
编程语言 时间:
2020-04-29 20:09:39
阅读次数:
427