前言:设计一个监控系统从哪入手呢? 前篇已经提到过监控系统的重要性,那么一个较为良好的监控系统应该从哪几方面上手的呢?我个人理解可以通过以下几个方面入手: 评估业务类型,架构体系; 分类监控; 监控技术方案选型; 监控人员规划; 监控系统的部署; 数据采集; 监控数据分析与算法; 系统测试; 自动化 ...
分类:
其他好文 时间:
2019-01-01 23:58:21
阅读次数:
239
其实不太想用opentsdb,一直以来用influxdb+grafana挺方便的,而且tsdb依赖hbase,虽说容量和速度有保证,但是分布式系统对于一个监控平台来说,终归还是有些重了,出问题定位更繁琐,但领导说用那就用吧。在这里必须吐一下OpenTSDB和Tcollector的文档更新,太落后,看官方文档根本找不到配置文件的位置。最后还得看源码,尤其是TCollector,这个tsdb官方推出的
分类:
数据库 时间:
2018-05-23 21:14:32
阅读次数:
387
在企业生产环境中,如果要分析系统资源,如CPU、内存、磁盘等使用情况,除了用top等命令外,也可以使用nmon工具,这款工具功能比较强大,在之前的公司中也有用到。一、nmon介绍nmon是IBM提供的免费在AIX与Linux操作系统上广泛使用的监控与分析工具。可收集服务器的系统资源使用..
分类:
其他好文 时间:
2017-05-14 21:40:23
阅读次数:
272
做运维的同学都知道,运维一定离不开Zabbix、Nagios之类的监控软件。目前,类似的软件在监控和数据采集方面已经做到了极致,但是在报警处理上并没有很完美的解决方案,比如,经常出现高质量报警湮没在海量报警之中等情况。本文不探讨监控系统的配置优化,只探讨监控系统按照它..
分类:
其他好文 时间:
2017-03-26 14:40:37
阅读次数:
199
一、监控系统的简单介绍(1)cacti:存储数据能力强,报警性能差(2)nagios:报警性能差,存储数据仅有简单的一段可以判断是否在合理范围内的数据长度,储存在内存中。比如,连续采样数据存储,有连续三次不在合理范围内的数据就报警(3)zabbix:结合上面两种工具的优点,又..
分类:
系统相关 时间:
2017-02-07 16:47:29
阅读次数:
265
##监控的必要性>在一个IT环境中会存在各种各样的设备,比如:硬件设备,软件设备,系统环境,运行服务。那么在这么复杂的环境下,尤其是大公司里成千上万的服务器我们如何去管理和维护呢?如何能保证公司资源的正常运转?我们通过什么手段去及时掌握基础环境和业务应用的可..
分类:
其他好文 时间:
2016-10-14 01:04:59
阅读次数:
312
随着容器时代到来,公司对devops等概念理解越来越深刻,业务系统架构也在不断向微服务架构调整。业务系统也不断的提供更多的api接口,实现方便灵活的调用。在这种业务背景下,感觉业务系统的监控系统(zabbix、cacti)等,略显笨重,在使用灵活度上感觉也略显欠佳。那么有没有..
分类:
数据库 时间:
2016-04-03 20:31:59
阅读次数:
841
Zabbix监控系统深度实践(企业级分布式系统自动化运维必选利器,大规模Zabbix集群实战经验技巧总结,由浅入深全面讲解配置、设计、案例和内部原理)姚仁捷著ISBN978-7-121-24013-32014年8月出版定价:69.00元364页16开编辑推荐国内最大规模Zabbix集群负责人力作全面讲解Zabbix..
分类:
其他好文 时间:
2014-09-19 12:16:36
阅读次数:
266
在阅读这篇文章之前,我们默认您已经具备了Linux基本操作技能,能够搭建LAMP环境,了解SNMP简单网络管理协议以及RRDTool绘图工具的使用。环境:CentOS6.5x86Cacti-0.8.8b一、概述首先,我们对监控要有一定的了解,我们需要层层递进。什么是监控?Linux上常见的监控方式(命令或..
分类:
其他好文 时间:
2014-08-08 16:25:26
阅读次数:
439