RABBITMQ集群及HA、LB

时间：2015-11-24 18:50:23 阅读：2632 评论：0 收藏：0 [点我收藏+]

RABBITMQ集群及HA、LB

一、Rabbitmq简介

RabbitMQ是一个开源的AMQP实现，服务器端用Erlang语言编写，支持多种客户端，如：Python、Ruby、.NET、Java、JMS、C、PHP、ActionScript、XMPP、STOMP等，支持AJAX。用于在分布式系统中存储转发消息，在易用性、扩展性、高可用性等方面表现不俗。

AMQP，即Advanced message Queuing Protocol，高级消息队列协议，是应用层协议的一个开放标准，为面向消息的中间件设计。消息中间件主要用于组件之间的解耦，消息的发送者无需知道消息使用者的存在，反之亦然。

AMQP的主要特征是面向消息、队列、路由（包括点对点和发布/订阅）、可靠性、安全。

rabbitmq是使用erlang开发的,集群非常方便,且天生就支持并发分布式,但自身并不支持负载均衡. 常规的博客介绍都是说rabbitmq有几种部署模式,其中最常用的也就两种:

1，单一模式: 就是不做ha...

2，镜像模式模式: active/active模式的ha,当master挂掉了,按照策略选择某个slave(其实就是最先加入集群的那个slave)来担当master的角色。

1. Rabbitmq系统架构

RabbitMQ Server：也叫broker server，是一种传输服务，负责维护一条从Producer到consumer的路线，保证数据能够按照指定的方式进行传输。

Producer，数据的发送方。

Consumer，数据的接收方。

Exchanges 接收消息，转发消息到绑定的队列。主要使用3种类型：direct， topic， fanout。

Queue RabbitMQ内部存储消息的对象。相同属性的queue可以重复定义，但只有第一次定义的有效。

Bindings 绑定Exchanges和Queue之间的路由。

Connection：就是一个TCP的连接。Producer和consumer都是通过TCP连接到RabbitMQ Server的。

Channel：虚拟连接。它建立在上述的TCP连接中。数据流动都是在Channel中进行的。也就是说，一般情况是程序起始建立TCP连接，第二步就是建立这个Channel。

二、 Rabbitmq安装

1. 安装 erlang 虚拟机

###安装 erlang 虚拟机，Rabbitmq 基于 erlang 语言开发，所以需要安装 erlang 虚拟机。

wget http://www.erlang.org/download/otp_src_R15B01. tar .gz

tar -xvf otp_src_R15B01.tar .gz

cdotp_src_R15B01

yum install make gcc gcc-c++ kernel-devel m4 ncurses-devel openssl-devel unixODBC unixODBC-devel

./configure --prefix=/usr/local/erlang --enable-hipe --enable-threads --enable-smp-support --enable-kernel-poll

make &make install

2. 安装 rabbitmq

wget http://www.rabbitmq.com/releases/rabbitmq-server/v3.5.6/rabbitmq-server-generic-unix-3.5.6. tar .gz

tar -xvf rabbitmq-server-generic-unix-3.2.1. tar .gz

mv rabbitmq_server-3.2.1 /usr/local/rabbitmq

cd /usr/local/rabbitmq/

rm LICENSE* -rf

# sbin/rabbitmqctl #<--提示没找到 erlang 虚拟机

sbin/rabbitmqctl: line 29: exec: erl: not found

##建立软连接，解决 erlang 虚拟机路径问题

ln -s /usr/local/erlang/bin/erl /usr/local/bin/

mkdir /data/rabbitmq/data /data/rabbitmq/log -p #<--建立存放数据日志目录

# vim /usr/local/rabbitmq/etc/rabbitmq/rabbitmq-env .conf

RABBITMQ_NODE_IP_ADDRESS=10.168.185.96

RABBITMQ_MNESIA_BASE=/data/rabbitmq/data

RABBITMQ_LOG_BASE=/data/rabbitmq/log

# vim /usr/local/rabbitmq/etc/rabbitmq/rabbitmq #<--设置日志级别

[

{rabbit, [{log_levels, [{connection, error}]}]}

启动 rabbitmq

/usr/local/rabbitmq/sbin/rabbitmq-server –detached& 启后默认端口是： rabbitmq 的默认端口是 5672.

停止程序：

/usr/local/rabbitmq/sbin/rabbitmqctl stop #若单机有多个实例，则在 rabbitmqctl 后加–n 指定名称

3. RABBITMQ页面（web）管理

启用 rabbitmq web 管理插件:

/usr/local/rabbitmq/sbin/rabbitmq-plugins enable rabbitmq_management

关闭 rabbitmq 管理插件：

/usr/local/rabbitmq/sbin/rabbitmq-plugins disable rabbitmq_management

列出所有插件：

/usr/local/rabbitmq/sbin/rabbitmq-plugins list

4. Rabbitmq创建用户

如果是集群的话，只要在一台主机设置即可，其它会自动同步。

#rabbitmqctl add_user admin 123456 –admin为新建的用户，123456为密码

#rabbitmqctl set_user_tags admin administrator –将用户设置为管理员角色

#rabbitmqctl set_permissions -p / admin ".*" ".*" ".*"

–在 / 虚拟主机里设置iom用户配置权限，写权限，读权限。.*是正则表达式里用法。rabbitmq的权限是根据不同的虚拟主机（virtual hosts）配置的，同用户在不同的虚拟主机（virtual hosts）里可能不一样。

5. Rabbitmq安全特性

（1）publish消息确认机制

如果采用标准的 AMQP 协议，则唯一能够保证消息不会丢失的方式是利用事务机制 — 令 channel 处于 transactional 模式、向其 publish 消息、执行 commit 动作。在这种方式下，事务机制会带来大量的多余开销，并会导致吞吐量下降 250% 。为了补救事务带来的问题，引入了 confirmation 机制（即 Publisher Confirm）。

confirm 机制是在channel上使用 confirm.select方法，处于 transactional 模式的 channel 不能再被设置成 confirm 模式，反之亦然。

在 channel 被设置成 confirm 模式之后，所有被 publish 的后续消息都将被 confirm（即 ack）或者被 nack 一次。但是没有对消息被 confirm 的快慢做任何保证，并且同一条消息不会既被 confirm 又被 nack 。

RabbitMQ 将在下面的情况中对消息进行 confirm ：

RabbitMQ发现当前消息无法被路由到指定的 queues 中；

非持久属性的消息到达了其所应该到达的所有 queue 中（和镜像 queue 中）；

持久消息到达了其所应该到达的所有 queue 中（和镜像 queue 中），并被持久化到了磁盘（被 fsync）；

持久消息从其所在的所有 queue 中被 consume 了（如果必要则会被 acknowledge）。

（2）consumer消息确认机制

为了保证数据不被丢失，RabbitMQ支持消息确认机制，即acknowledgments。

如果没启动消息确认机制，RabbitMQ在consumer收到消息后就会把消息删除。

启用消息确认后，consumer在处理数据后应通过回调函数显示发送ack， RabbitMQ收到ack后才会删掉数据。如果consumer一段时间内不回馈，RabbitMQ会将该消息重新分配给另外一个绑定在该队列上的consumer。另一种情况是consumer断开连接，但是获取到的消息没有回馈，则RabbitMQ同样重新分配。

注意：如果consumer 没调用basic.qos 方法设置prefetch_count=1，那即使该consumer有未ack的messages，RabbitMQ仍会继续发messages给它。

（3）消息持久化

消息确认机制确保了consumer退出时消息不会丢失，但如果是RabbitMQ本身因故障退出，消息还是会丢失。为了保证在RabbitMQ出现意外情况时数据仍没有丢失，需要将queue和message都要持久化。

queue持久化：channel.queue_declare(queue=’hello’, durable=True)

message持久化：channel.basic_publish(exchange=”,

routing_key=”task_queue”,

body=message,

properties=pika.BasicProperties(

delivery_mode = 2,) #消息持久化

)

即使有消息持久化，数据也有可能丢失，因为rabbitmq是先将数据缓存起来，到一定条件才保存到硬盘上，这期间rabbitmq出现意外数据有可能丢失。

网上有测试表明：持久化会对RabbitMQ的性能造成比较大的影响，可能会下降10倍不止。

三、Rabbitmq集群

1. RABBITMQ集群基本概念

一个RABBITMQ集群中可以共享user，virtualhosts，queues（开启Highly Available Queues），exchanges等。但message只会在创建的节点上传输。当message进入A节点的queue中后，consumer从B节点拉取时，RabbitMQ会临时在A、B间进行消息传输，把A中的消息实体取出并经过B发送给consumer。所以consumer应尽量连接每一个节点，从中取消息。

RABBITMQ的集群节点包括内存节点、磁盘节点。内存节点的元数据仅放在内存中，性能比磁盘节点会有所提升。不过，如果在投递message时，打开了message的持久化，那么内存节点的性能只能体现在资源管理上，比如增加或删除队列（queue），虚拟主机（vrtual hosts），交换机（exchange）等，发送和接受message速度同磁盘节点一样。一个集群至少要有一个磁盘节点。

2. RABBITMQ搭建集群

（1）部署网络环境：

有三台机器(mq-cluster1,2,3) rabbitmq的执行用户为rabbitmq，所属组rabbitmq。直接将以下内容其加到/etc/hosts文件中

其中mq-cluster1为master,其余的为slave

（2）同步erlang.cookie文件

我是以mq-cluster1为master的,所以需要将其内容覆盖到mq-cluster2和mq-cluster3中

杀掉rabbitmq2和rabbitmq3的rabbitmq进程：

#ps –ef|grep rab|awk ‘{print $2}’|xargs kill -9。–用service rabbitmq-servier stop停止会有遗留进程。

scp 同步完成后，启动mq_cluster2和mq_cluster3的rabbitmq服务

（3）设置ha模式

rabbitmqctl set_policy [-p <vhostpath>] [--priority <priority>] [--apply-to <apply-to>] <name> <pattern> <definition>

name 策略名称

pattern 正则表达式,用来匹配资源,符合的就会应用设置的策略

definition 是json格式设置的策略。

apply-to 表示策略应用到什么类型的地方,一般有queues,exchange和all,默认是all

priority 是个整数优先级

其中ha-mode有三种模式:

all: 同步至所有的.

exactly: 同步最多N个机器. 当现有集群机器数小于N时,同步所有,大于等于N时则不进行同步. N需要额外通过ha-params来指定.

nodes: 只同步至符合指定名称的nodes. N需要额外通过ha-params来指定.# 这里设置的是同步全部的queue, 可以按需自己选择指定的queue

rabbitmqctl set_policy ha-all ‘.*‘ ‘{"ha-mode":"all"}‘

（4） cluster2,3加入集群

在mq-cluster2和mq-cluster3中分别执行:

rabbitmqctl stop_app

rabbitmqctl join_cluster rabbit@mq-cluster1

rabbitmqctl start_app

加入之后, 可以通过rabbitmqctl cluster_status来查看cluster状态.

ps:默认加入是一disc模式加入,可以执行rabbitmqctl change_cluster_node_type <ram|disc>进行模式的修改

（5）更改节点属性

#rabbitmqctl stop_app –停止rabbitmq服务

#rabbitmqctl change_cluster_node_type disc/ram –更改节点为磁盘或内存节点

#rabbitmqctl start_app –开启rabbitmq服务

在rabbitmq 2.中使用:

#rabbitmqctl stop_app

#rabbitmqctl force_cluster rabbit@mq-cluster1 #不加自己的node_name,是ram模式

#rabbitmqctl force_cluster rabbit@mq-cluster1 rabbit@mq-cluster2 #加自己的node_name 是disk模式

3. RABBITMQ退出集群

假设要把rabbitmq2退出集群

在rabbitmq2上执行

#rabbitmqctl stop_app

#rabbitmqctl reset

#rabbitmqctl start_app

在集群主节点上执行

# rabbitmqctl forget_cluster_node rabbit@mq-cluster2

4. RABBITMQ集群重启

集群重启时，最后一个挂掉的节点应该第一个重启，如果因特殊原因（比如同时断电），而不知道哪个节点最后一个挂掉。可用以下方法重启：

先在一个节点上执行

#rabbitmqctl force_boot

#service rabbitmq-server –detached&

在其他节点上执行

#service rabbitmq-server –detached&

查看cluster状态是否正常（要在所有节点上查询）。

#rabbitmqctl cluster_status

如果有节点没加入集群，可以先退出集群，然后再重新加入集群。

上述方法不适合内存节点重启，内存节点重启的时候是会去磁盘节点同步数据，如果磁盘节点没起来，内存节点一直失败。

5. 注意事项

§ cookie在所有节点上必须完全一样，同步时一定要注意。

§ erlang是通过主机名来连接服务，必须保证各个主机名之间可以ping通。可以通过编辑/etc/hosts来手工添加主机名和IP对应关系。如果主机名ping不通，rabbitmq服务启动会失败。

§ 如果queue是非持久化queue，则如果创建queue的那个节点失败，发送方和接收方可以创建同样的queue继续运作。但如果是持久化queue，则只能等创建queue的那个节点恢复后才能继续服务。

§ 在集群元数据有变动的时候需要有disk node在线，但是在节点加入或退出的时候所有的disk node必须全部在线。如果没有正确退出disk node，集群会认为这个节点当掉了，在这个节点恢复之前不要加入其它节点。

四、Rabbitmq HA

1. 镜像队列概念

镜像队列可以同步queue和message，当主queue挂掉，从queue中会有一个变为主queue来接替工作。

镜像队列是基于普通的集群模式的,所以你还是得先配置普通集群,然后才能设置镜像队列。

镜像队列设置后，会分一个主节点和多个从节点，如果主节点宕机，从节点会有一个选为主节点，原先的主节点起来后会变为从节点。

queue和message虽然会存在所有镜像队列中，但客户端读取时不论物理面连接的主节点还是从节点，都是从主节点读取数据，然后主节点再将queue和message的状态同步给从节点，因此多个客户端连接不同的镜像队列不会产生同一message被多次接受的情况。

2. 配置镜像队列

沿用3.2的环境，现在我们把名为“hello”的队列设置为同步给所有节点

#rabbitmqctl set_policy ha-all ‘hello’ ‘{“ha-mode”:”all”}’

ha-all 是同步模式，指同步给所有节点，还有另外两种模式ha-exactly表示在指定个数的节点上进行镜像，节点的个数由ha-params指定，ha-nodes表示在指定的节点上进行镜像，节点名称通过ha-params指定；

hello 是同步的队列名，可以用正则表达式匹配；

{“ha-mode”:”all”} 表示同步给所有，同步模式的不同，此参数也不同。

执行上面命令后，可以在web管理界面查看queue 页面，里面hello队列的node节点后会出现+2标签，表示有2个从节点，而主节点则是当前显示的node（xf7021是测试用的名字，按4-2应该为rabbitmq（1-3））。

3. 测试rabbitmq的ha

测试的python代码,依次发送消息到三个rabbitmq-server中,

可以随机的操作去关闭任意一个mq-cluster上的rabbitmq-server服务, 再通过rabbitmqctl list_queues来查看消息的数量. 可以看到,尽管master挂了,消息依然能够发送成功,且当挂掉的机器(master或者slave)重新起起来之后,消息会马上同步过去.

4. 搭建haproxy

安装和初始配置haproxy此处从略.

在配置好的/etc/haproxy/haproxy.cfg尾端加上以下内容

接着启动haproxy

haproxy -f /etc/haproxy/haproxy.cfg -D

5. 测试rabbitmq的haproxy下的lb

将之前的测试代码中的

mq_servers = [‘10.22.129.57‘, ‘10.22.129.58‘, ‘10.22.129.59‘]

改成

mq_servers = [‘10.22.129.53‘, ‘10.22.129.53‘, ‘10.22.129.53‘]

执行测试代码,发现三个消息均发送成功,然后即使手动关闭其中一台mq,消息依然发送成功,通过rabbitctl list_queues也依然可以看到消息是成功收到３条的.

至此，可以看到rabbitmq-server成功的解除了single-point状态。

本文出自 “黄怡善的运维博客” 博客，请务必保留此出处http://linuxpython.blog.51cto.com/10015972/1716372

RABBITMQ集群及HA、LB

标签：rabbitmq

原文地址：http://linuxpython.blog.51cto.com/10015972/1716372

踩

(0)

评论一句话评论（0）

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)

周排行

RABBITMQ集群及HA、LB

（2） 同步erlang.cookie文件

3. 测试rabbitmq的ha

5. 测试rabbitmq的haproxy下的lb

（2）同步erlang.cookie文件