运维工程师不可避免得会遇到各种故障的情况,[可控]是运维团队追求的终极目标之一
包括故障的可控性,所以衍生出以下的子目标:
1. 降低故障概率
海恩法则:每一起严重事故的背后,必然有29次轻微事故和300次未遂先兆,以及1000个事故隐患。
用数据说话,统计各种异常的原因分布:
网络与硬件外部门人员配合程序代码原因架构设计缺陷数据库部署错误人为错误其他
累计一...
分类:
其他好文 时间:
2015-08-30 15:50:42
阅读次数:
346
linux运维故障处理:http://book.51cto.com/art/201405/438561.htmRHEL7.0系统安装图解:http://os.51cto.com/art/201406/442839.htm红帽子官方手册:https://access.redhat.com/documentation/zh-CN/一、linux中文显示乱码解决办法:vi/etc/sysconfig/i18n将内容改为LANG="zh_C..
分类:
系统相关 时间:
2015-05-25 14:51:39
阅读次数:
539
如果公司的邮箱服务器挂了,我们又没有做高可用,这个时候我们需要尽快地恢复邮箱数据库,并且保证邮箱正常收发邮件。现在我们需要用到邮箱数据库的备份了,一般情况下,我们会把数据库备份在共享存储中,或者至少是备份在另一台服务器上。我们采用的方法是将存储里面的数据库文件复制出来,在新的服务器上部署Exchange并创建新的数据库,然后将源数据库文件覆盖到新数据库文件中,最后把源数据库中的所有用户移植至新的数据库。...
分类:
其他好文 时间:
2014-10-22 18:14:52
阅读次数:
368
dmidecode-tprocessor|grepSocket(物理cpu个数)
dmidecode|grepSize|grepMB|awk‘{a+=$2}END{printa}‘(物理内存大小MB)
dmidecode|grepSize|grepMB|wc-l(物理内存个数)
ps-eopid,lstart,etime|grep26871(进程运行时间)
26871ThuSep2617:08:55201300:19让Linux在终端支持..
分类:
系统相关 时间:
2014-05-09 07:09:18
阅读次数:
442