先创建一个Template如果需要在Template上使用Application需要先链接到要监控的主机准备测试用的WEB页面:添加Trigger:添加Trigger后,再可以添加Actions,如邮件告警(告警升级),执行脚本等操作。
分类:
Web程序 时间:
2016-04-30 01:12:29
阅读次数:
213
下面添加Templates:Configuration--Templates---CreateTemplate找到刚新建的Template(Configuration---Templates---NetworkTraffic)在Template上添加Application/Items/Triggers/Graphs/Screens等。按之前新建的方法创建:链接刚创建的模版:Screens还是得新创建:Action配置..
分类:
其他好文 时间:
2016-04-29 20:13:06
阅读次数:
216
三年多前,我在腾讯负责的活动运营系统,因为业务流量规模的数倍增长,系统出现了各种各样的异常,当时,作为开发的我,7*24小时地没日没夜处理告警,周末和凌晨也经常上线,疲于奔命。后来,当时的老领导对我说:你不能总扮演一个“救火队长”的角色, 要尝试从系统整体层面思考产生问题的根本原因,然后推进解决。 ...
分类:
Web程序 时间:
2016-04-28 14:17:30
阅读次数:
258
监控思路、架构介绍需求:使用shell定制各种个性化告警工具,但需要统一化管理、规范化管理。思路:指定一个脚本包,包含主程序、子程序、配置文件、邮件引擎、输出日志等。主程序:作为整个脚本的入口,是整个系统的命脉。配置文件:是一个控制中心,用它来开关各个子程序,指..
分类:
系统相关 时间:
2016-04-26 22:25:55
阅读次数:
345
Firmware Warn 问题描述: 系统版本:Ubuntu 12.04 LTS。 系统启动后dmesg打印大量Firmware Warn告警信息到syslog文件中。信息如下: [Firmware Warn]: GHES: Failed to read error status block ad ...
分类:
其他好文 时间:
2016-04-26 17:36:11
阅读次数:
885
告警系统架构如下 1、 数据处理系统处理完原始数据并入库后,发送消息到kafka系统; 2、 告警生产者从kafka系统查询消息存入告警消息队列; 3、 告警消费者从告警消息队列查询消息进行处理。 这显然是生产者消费者模型,一个告警消息生产者,多个告警消息消费者。生产者生产消息过快会产生消息积压,生 ...
分类:
其他好文 时间:
2016-04-24 18:49:17
阅读次数:
139
告警性能优化过程中,遇到如下问题:1、 在数据库计算几十万个实体的KPI值的方差;2、 计算结果进行表格化处理。 这里KPI包含多个Counter的数据库函数运算(比如Decode,AVG等函数),方差也是数据库函数运算,性能比较差。 步骤1中每个实体独立计算方差,步骤2需要方差结果协同处理,所以很 ...
分类:
编程语言 时间:
2016-04-24 17:10:44
阅读次数:
173
最近项目中进行告警模块性能优化,不少地方使用了线程池技术,整理总结如下。 ...
分类:
编程语言 时间:
2016-04-24 14:21:00
阅读次数:
276
写一个监控网站的脚本。发现不正常发邮件告警。每分钟检测一次。提示:使用curl命令检测,根据结果判断。#!/bin/bash
url=http://www.apelearn.com/bbs/forum.php
ip1=1.1.1.1
ip2=2.2.2.2
ip3=3.3.3.3
cop="--connect-timeout3-I"
check(){
curl$cop-x$1:80$url2>/dev/null..
分类:
Web程序 时间:
2016-04-22 01:14:46
阅读次数:
249
问题描述:
某平台,今天突然发现所有人都能登陆平台,之前数据也能看到,但无法录入新数据。
读取告警日志发现有以下错误信息:
ORA-00257:archivererror.Connectinternalonly,untilfreed
这个错误出现是无法归档造成的。出现无法归档的原因主要为:
1、归档存储磁..
分类:
其他好文 时间:
2016-04-20 18:19:40
阅读次数:
185