前言 做好日常巡检是数据库管理和维护的重要步骤,而且需要对每次巡检日期、结果进行登记,同时可能需要出一份巡检报告。 本系列旨在解决一些常见的困扰: 不知道巡检哪些东西 不知道怎么样便捷体检 机器太多体检麻烦 生成报告困难,无法直观呈现结果 经过硬件巡检,数据库状态情况的巡检无疑是日常运维巡检的第二步 ...
分类:
数据库 时间:
2016-12-15 11:25:34
阅读次数:
173
今天给大家分享一个维修案例:机器型号:SA5212M4,阵列是LSI卡,最初级的阵列卡,硬盘有小问题时不会告警。此机有后置硬盘,属于定制机器。今天运维发邮件告知有台浪潮服务器硬盘有故障。但我们现场巡检没发现有问题,没有任何报错,状态灯正常。当时我想到的是可以硬盘有坏道..
分类:
其他好文 时间:
2016-12-08 14:06:41
阅读次数:
261
交换机的前面板有几个指示灯,用于监控系统的活动和性能。这些指示灯称之为发二极管(LED)1、系统指示灯:显示系统是否已经接通电源并且正常工作。琥珀色:系统加电,运行状态不正常2、远程电源供应(RPS)指示灯:指示灯显示交换机是否有远程电源供电,持续琥珀色RPS已连接但动..
分类:
系统相关 时间:
2016-12-05 23:48:00
阅读次数:
182
之前试过用expect结合bash脚本备份交换机LOG,但由于是串行执行,设备很多的情况下耗时太长,而且经常出错导致备份不完整。于是在网上找python多线程处理的相关文章,但基本都是基于tftp备份当时运行的配置文件,不能根据自定义巡检命令取得返回结果,我想要的是类似SECURECRT..
分类:
编程语言 时间:
2016-12-01 15:08:04
阅读次数:
801
前言感想:一时兴起,突然想写一个关于MS SQL的巡检系列方面的文章,因为我觉得这方面的知识分享是有价值,也是非常有意义的。一方面,很多经验不足的人,对于巡检有点茫然,不知道要从哪些方面巡检,另外一方面,网上关于MS SQL巡检方面的资料好像也不是特别多。写这个系列只是一个分享,自己的初衷是一个知识... ...
分类:
数据库 时间:
2016-11-08 13:53:55
阅读次数:
246
因为这段时间一直在弄监控,但是工作还是在进行中 因为机器不多,所以今天早上巡检了一下,看到一台生产机器上的CPU飙高 top 然后就请出了大神工具JVM 具体JVM的介绍看:http://www.cnblogs.com/smail-bao/p/6027756.html CPU飙高的话,我们就是用js ...
分类:
编程语言 时间:
2016-11-04 13:24:08
阅读次数:
284
1.机房巡检,报机器位置A02-2(22U-25U),告警灯橙色亮2.核实系统为二代支付3.用ROOT用户登录系统,输入errpt -a查看告警信息如下: 4.确定是HDISK2硬盘发生故障,拨打IBM电话:8008101818进行报修5.厂家打来电话,告知哪块硬盘坏了,FRU号是多少,多大的盘,输... ...
分类:
其他好文 时间:
2016-09-26 20:16:54
阅读次数:
174
在日常的监控运维中,因监控的内容较多,人较少的情况下,监控对本省的日常巡检成了一个重大的累赘(我们不可能每天对每一个检测项的状态进行检查,工作量,我的天呢),虽然我们可以使用zabbix自身报警,邮件等手段,但是,填写巡检表的时候,嘿嘿嘿,麻烦的让人想吐。监控自..
分类:
其他好文 时间:
2016-09-01 00:44:50
阅读次数:
187
在linux主机安全检查中有这么一项:限制su成root的用户或组。正常情况下,我们使用普通用户管理设备和巡检,但是经常有一部分人员不断尝试su到root用户,如果尝试次数过多,root用户就会被临时锁定,为了避免这种情况和提高安全性。我们必须通过设置来禁止普通用户使用su命令切..
分类:
其他好文 时间:
2016-08-31 12:24:36
阅读次数:
158
运维分类: 机房运维(负责设备上下架、巡检、报修、硬件监控) 基础设施运维(系统初始化、网络维护) 基础服务运维(内部DNS、负载均衡、系统监控、资产管理、运维平台)包含运维开发 系统运维(架构层面的分布式缓存、分布式文件系统、日志收集、环境规划(测试、开发、生产)、架构设计、性能优化) 安全运维( ...
分类:
其他好文 时间:
2016-08-27 11:13:19
阅读次数:
388