码迷,mamicode.com
首页 >  
搜索关键字:logstash 监控海量日志 报警    ( 3957个结果
Redis哨兵
1哨兵的作用哨兵是redis集群架构中非常重要的一个组件,主要功能如下:集群监控:负责监控redismaster和slave进程是否正常工作消息通知:如果某个redis实例有故障,那么哨兵负责发送消息作为报警通知给管理员故障转移:如果masternode挂掉了,会自动转移到slavenode上配置中心:如果故障转移发生了,通知client客户端新的master地址2哨兵的核心知识故障转移时,判断一
分类:其他好文   时间:2019-09-08 20:11:36    阅读次数:82
良许 | 同事的一个动作,让我熬夜的工作全部白费……
熊孩子,是一种神奇的生物 他们天不怕,地不怕 破坏力巨大,续航能力又十足 还有《未成年人保护法》为他们保驾护航…… 在家里受到这些熊孩子的破坏也就算了, 但在公司里,有些同事的破坏力不亚于那些熊孩子 看到服务器在跑, 他们会这边戳戳,那边动动 就俩字——手贱!! 如果不小心, 你熬夜做的工作, 可能 ...
分类:其他好文   时间:2019-09-02 13:40:41    阅读次数:90
02:linux 磁盘满了,却找不到大文件问题处理 lsof命令
今天,上午收到zabbix 报警。 报警内容:一台服务器,磁盘满了。 故障排查步骤: 之前磁盘满了,一般都是由于服务器上面再跑的服务日志引起的占用太多空间,服务器上有java程序,去删除多余的日志就可以了。但是我记得这台服务器我是做过日志自动清理机制的。 因此登录服务器,df -h 发现磁盘91% ...
分类:系统相关   时间:2019-09-01 12:30:14    阅读次数:255
Linux下查看文件和文件夹大小 删除日志
场景:在sts中执行自动部署时候maven提示No space left on device错误,后来经检查发现是磁盘空间满了,用下面的方法分析发现tomcat下面的logs目录占用了很大的空间,删除多余的日志问题解决! 1 Linux下查看文件和文件夹大小 当磁盘大小超过标准时会有报警提示,这时如 ...
分类:系统相关   时间:2019-09-01 11:06:08    阅读次数:187
Ganglia与Centreon整合构建智能化监控报警平台
一、智能运维监控报警平台的组成 随着大数据时代的来临,运维工作的难度越来越大,每个运维人员都要面临不计其数的服务器和海量的数据,如何保证众多服务器和业务系统稳定高效地运行并尽量减少死机时间,成为考核运维工作的重要指标,而要实现大规模的运维,必须要有一套行之有效的智能运维监控管理系统,本章就详细介绍下 ...
分类:其他好文   时间:2019-08-31 23:50:41    阅读次数:263
Prometheus简介
一、Prometheus简介 Prometheus是一套开源的系统监控报警框架。它受启发于Google的Brogmon监控系统,由工作在SoundCloud的前google员工在2012年创建,作为社区开源项目进行开发,并于 2015年正式发布。 2016年,Prometheus正式加入Cloud ...
分类:其他好文   时间:2019-08-31 23:17:45    阅读次数:146
生产中一次内存使用过高排查过程
本文参考 ? https://blog.csdn.net/top_gun_1/article/details/50777329 我这里知道这个消息是通过bearychart报警消息获得的,报警的信息是, 当前服务器内存使用值已经达到了百分之九十二 由于该机器我无法从外网连接,所以周六来公司看了下情况 ...
分类:其他好文   时间:2019-08-31 17:34:55    阅读次数:99
JVM内存模型与JVM参数配置
前言:生产服务器内存使用过高预警,为了解决预警,重启了服务器;之后做总结; 事件过程:收到报警之后,查看日志信息,判断和前段时间的业务量并没有什么大的变化;又查看了下内存的使用情况,发现在一点点的上升;后续查看启动参数时,对于启动参数的配置,有一些疑义; 因此,对JVM内存模型与JVM参数配置进行一 ...
分类:其他好文   时间:2019-08-31 16:56:11    阅读次数:80
zabbix报警(向消息中心发送报警信息)
一、zabbix web界面的配置 重点:zabbix执行报警脚本时,有对脚本的执行权限,但是没有对脚本中的命令执行的权限,需要在sudoers文件中为zabbix用户添加用户权限。 1.创建脚本的报警媒介 脚本路径可以在server的配置文件中配置 输入脚本名称,类型选择脚本并添加以下3个参数,分 ...
分类:其他好文   时间:2019-08-30 19:03:52    阅读次数:97
生产环境缺陷来源VS 缺陷管理响应机制
生产环境缺陷主要来源于用户反馈、版本内遗留、内部反馈和监控后台报警,具体内容包含以下途径: 1、用户反馈: ① 前台电话方式 ② 意见反馈后台 ③ 第三方平台:如微博、App Store等渠道 2、版本内遗留: ① 业务线在版本测试中,发现的线上问题(bug的影响模块需要选成“主软件用户问题反馈”) ...
分类:其他好文   时间:2019-08-30 15:55:37    阅读次数:111
3957条   上一页 1 ... 66 67 68 69 70 ... 396 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!