建立WindowsServer2008R2FailoverCluster,基本环境:故障转移群集使用3台服务器进行多数仲裁1.DC2.3台WindowsServer2008R2SP1IP:192.168.13.121-123(Public)IP:192.168.11.121-123(Heartbeat)1.选择群集中的服务器2.创建群集前,先进行群集验证(因为使用的是多数仲裁,不使用额..
在分布式系统中经常使用心跳(Heartbeat)来检测Server的健康状况,但从理论上来说,心跳无法真正检测对方是否crash,主要困难在于无法真正区别对方是宕机还是“慢”。传统的检测方法是设定一个超时时间T,只要在T之内没有接收到对方的心跳包便认为对方宕机,方法简单粗暴,但使用广泛。1. 传统错...
分类:
其他好文 时间:
2014-08-29 23:58:08
阅读次数:
512
本文对如何诊断RAC环境中节点重启问题进行了介绍。适用于10gR2和11gR1.
首先我们对能够导致节点重启的CRS进程进行介绍。
1.ocssd : 它的主要功能是节点监控(Node Monitoring)和组管理(Group Management),它是CRS的核心进程之一。节点监控是指监控集群中节点的健康,监控的方法是通过网络心跳(network heartbeat)和磁盘心跳(...
分类:
其他好文 时间:
2014-08-29 18:24:08
阅读次数:
272
1、软件包准备nagios-4.0.8.tar.gznagios-plugins-2.0.3.tar.gznrpe-2.15.tar.gzhttpd-2.2.23.tar.gz2、NagiosServer端安装1)、安装相关依赖包yuminstall-ygccglibcglibc-commongdgd-develxinetdopenssl-devel2)、安装Nagios#useradd-s/sbin/nologinnagios#configure--prefix=..
分类:
移动开发 时间:
2014-08-28 02:09:19
阅读次数:
296
原码安装heartbeat需要三个包1.groupaddhaclient2.useradd-ghaclienthaclusterHeartbeat-3-0-7e3a82377fa8.tar.bz2Reusable-Cluster-Components-glue--glue-1.0.9.tar.bz2ClusterLabs-resource-agents-v3.9.2-0-ge261943.tar俩台主机centos6.51安装Gluetar-jxvfReusable-Cluste..
分类:
其他好文 时间:
2014-08-27 11:09:38
阅读次数:
282
本人进入IT行业已接近5个年头,刚入行的时候带着仅有网络基础和系统基础,在校外培训过CCNA和CCNP,还有RHCE,顺利的进入了一家规模还算大的企业,由于是零经验,所学的知识也只是基于理论完全没有工作经验,因此是从基础做起,刚开始的职位是运维监控工程师,当时这职位有5个..
分类:
移动开发 时间:
2014-08-26 02:57:26
阅读次数:
703
与在redhat安装nagios相比,在ubuntu安装nagios监控非常简单,直接通过apt-get即可从ubuntu的服务器上下载组件自动安装。sudoapt-getinstallnagios3nagios-nrpe-plugin给nagiosadmin添加一个密码:sudohtpasswd/etc/nagios3/htpasswd.usersnagiosadmin添加一个用户:sudohtpass..
分类:
移动开发 时间:
2014-08-24 04:06:32
阅读次数:
909
遇到一个奇葩问题,nagios监控windows下面的cpu服务项出现如下警告信息:(但是其他服务项状态Ok,且此警告信息过一会自动会恢复Ok状态再过一段时间又会变成如下图中的警告信息状态warning)解决思路:第一:排查造成此情况的原因:Nsclient++版本原因(经排查同样版本的服务器C..
分类:
移动开发 时间:
2014-08-22 18:10:29
阅读次数:
321
ERROR: no read quorum in group: required 2, found 0 disksERROR: Could not heartbeat PST for grp 5. Force dismounting the disk group.ERROR: no read quo...
分类:
其他好文 时间:
2014-08-22 12:21:56
阅读次数:
267