这次是IBMX3550X5两节点堆叠服务器搬迁引发的一个故障处理过程记录:首先引用一下百度文库中的一篇文章。按照我附件的文档指导配置完成堆叠后,是成功运行的。搬迁后,按照顺序把两台服务器连接起来后,IMM可以正常登陆。但是remotecontrol时,报无信号。最后发现是IMM的管理地..
分类:
其他好文 时间:
2016-05-27 14:57:11
阅读次数:
212
1,My.cnf中用户名密码无效在azure云上面,使用Zabbix监控mysql中,发现在/usr/local/mysql/my.cnf里面设置的默认用户名密码无效,出不来数据,而且在zabbix服务器上,使用zabbix_get也报错failed,如下[root@zabbix_serv_121_12 ~]#/usr/local/zabbix/bin/zabbix_get -s 192.168....
分类:
数据库 时间:
2016-05-08 10:30:17
阅读次数:
1911
配置drbd过程出现Primary/Unknown故障,最后通过如下方式解决。1,节点状态查看(1)主节点状态[root@app1drbd.d]#cat/proc/drbdversion:8.4.3(api:1/proto:86-101)GIT-hash:89a294209144b68adb3ee85a73221f964d3ee515buildbygardner@,2013-11-2912:28:000:cs:StandAlonero:Prima..
分类:
其他好文 时间:
2016-04-30 01:12:02
阅读次数:
555
进程—异常控制流之故障、终止篇一、Exceptions(异常) and System Call(系统调用)
1.1 故障
故障由错误情况引起,它可能能够被故障处理程序修正。当故障发生时,处理器将控制转移
给故障处理程序。如果处理程序能够修正这个错误情况,它就将控制返回到引起故障的指令,从
而重新执行它。否则,处理程序返回到内核中的abort 例程, abort 例程会终止引起故障的...
分类:
系统相关 时间:
2016-04-22 19:37:44
阅读次数:
165
提升服务器响应能力的方式: ScaleOn:向上扩展 升级服务器硬件 ScaleOut:向外扩展 增加服务器个数 集群类型: LB:LoadBalance负载均衡集群 并发处理能力 HA:HighAvailability高可用集群 在线时间/(在线时间+故障处理时间) 99%,99.9%,99.99%,99.999% HPC:HighPerform..
分类:
其他好文 时间:
2016-04-05 20:12:32
阅读次数:
283
工作内容:数百个服务器(linux系统)日常维护、监控、报警及故障处理、数据迁移。工作待遇:1、按月足额发放,年底双薪;2、工作日餐补;3、五险,暂时无公积金。工作时间及地点:1、办公:地铁四号线公益西桥地铁站c口出即到;2、临时地点:各IDC机房或合作伙伴办公室3、工作..
分类:
其他好文 时间:
2016-03-26 20:41:48
阅读次数:
225
1、故障描述接到用户报障,生产某系统无法访问。同事接到报障后立即排查,经测试,系统确实无法访问,并且无法ping通服务器。2、故障处理由于客户端无法ping通服务器,需要进入机房查看。经查看,服务器硬件无报警,系统无重启。登录系统使用ifconfig命令查看,IP丢失(eth0不..
分类:
系统相关 时间:
2016-03-26 20:31:14
阅读次数:
322
jdk为我们提供了一系列的jvm性能监控和故障处理工具,在这里根据学习进度进行整理记录。便于之后查阅 1.jps 虚拟机进程工具 类似于Linux系统中的ps命令,用于查看虚拟机进程,常用的有以下功能 jps -l 显示虚拟机进程id以及进程主类 jps -q 只显示进程id,不显示主类名称 jps
分类:
其他好文 时间:
2016-03-18 13:22:52
阅读次数:
153
前言:同事问我,你写运维平台最先写哪一部分?好吧,还真把我问倒了,因为这是在问最应该放在放在第一位的东西~作为一个工作不足两年,运维不足一年的新手来说,还真不敢妄下评论,其实按照我的思路,觉得最重要的部分肯定是故障处理,报警,但是这一块怎么写?怎么说?肯定不..
分类:
编程语言 时间:
2016-03-06 23:52:01
阅读次数:
464