RabbitMQ分布式集群架构和高可用性（HA）

236次阅读

没有评论

共计 5279 个字符，预计需要花费 14 分钟才能阅读完成。

RabbitMQ 分布式集群架构和高可用性（HA）

(一）功能和原理

设计集群的目的

允许消费者和生产者在 RabbitMQ 节点崩溃的情况下继续运行
通过增加更多的节点来扩展消息通信的吞吐量

1 集群配置方式

RabbitMQ 可以通过三种方法来部署分布式集群系统，分别是：cluster,federation,shovel

cluster:
- 不支持跨网段，用于同一个网段内的局域网
- 可以随意的动态增加或者减少
- 节点之间需要运行相同版本的 RabbitMQ 和 Erlang
federation:应用于广域网，允许单台服务器上的交换机或队列接收发布到另一台服务器上交换机或队列的消息，可以是单独机器或集群。federation 队列类似于单向点对点连接，消息会在联盟队列之间转发任意次，直到被消费者接受。通常使用 federation 来连接 internet 上的中间服务器，用作订阅分发消息或工作队列。
shovel:连接方式与 federation 的连接方式类似，但它工作在更低层次。可以应用于广域网。

2 节点类型

RAM node:内存节点将所有的队列、交换机、绑定、用户、权限和 vhost 的 元数据 定义存储在内存中，好处是可以使得像交换机和队列声明等操作更加的快速。
Disk node:将元数据存储在磁盘中，单节点系统只允许磁盘类型的节点，防止重启 RabbitMQ 的时候，丢失系统的配置信息。

问题说明： RabbitMQ 要求在集群中至少有一个磁盘节点，所有其他节点可以是内存节点，当节点加入或者离开集群时，必须要将该变更通知到至少一个磁盘节点。如果集群中唯一的一个磁盘节点崩溃的话，集群仍然可以保持运行，但是无法进行其他操作（增删改查），直到节点恢复。
解决方案：设置两个磁盘节点，至少有一个是可用的，可以保存元数据的更改。

Erlang Cookie 是保证不同节点可以相互通信的密钥，要保证集群中的不同节点相互通信必须共享相同的 Erlang Cookie。具体的目录存放在 /var/lib/rabbitmq/.erlang.cookie。

说明： 这就要从 rabbitmqctl 命令的工作原理说起，RabbitMQ 底层是通过 Erlang 架构来实现的，所以 rabbitmqctl 会启动 Erlang 节点，并基于 Erlang 节点来使用 Erlang 系统连接 RabbitMQ 节点，在连接过程中需要正确的 Erlang Cookie 和节点名称，Erlang 节点通过交换 Erlang Cookie 以获得认证。

4 镜像队列

功能和原理
RabbitMQ 的 Cluster 集群模式一般分为两种，普通模式和镜像模式。

普通模式：默认的集群模式，以两个节点（rabbit01、rabbit02）为例来进行说明。对于 Queue 来说，消息实体只存在于其中一个节点 rabbit01（或者 rabbit02），rabbit01 和 rabbit02 两个节点仅有相同的元数据，即队列的结构。当消息进入 rabbit01 节点的 Queue 后，consumer 从 rabbit02 节点消费时，RabbitMQ 会临时在 rabbit01、rabbit02 间进行消息传输，把 A 中的消息实体取出并经过 B 发送给 consumer。所以 consumer 应尽量连接每一个节点，从中取消息。即对于同一个逻辑队列，要在多个节点建立物理 Queue。否则无论 consumer 连 rabbit01 或 rabbit02，出口总在 rabbit01，会产生瓶颈。当 rabbit01 节点故障后，rabbit02 节点无法取到 rabbit01 节点中还未消费的消息实体。如果做了消息持久化，那么得等 rabbit01 节点恢复，然后才可被消费；如果没有持久化的话，就会产生消息丢失的现象。
镜像模式：将需要消费的队列变为镜像队列，存在于多个节点，这样就可以实现 RabbitMQ 的 HA 高可用性。作用就是消息实体会主动在镜像节点之间实现同步，而不是像普通模式那样，在 consumer 消费数据时临时读取。缺点就是，集群内部的同步通讯会占用大量的网络带宽。

实现机制
镜像队列实现了 RabbitMQ 的高可用性（HA），具体的实现策略如下所示：

ha-mode	ha-params	功能
all	空	镜像队列将会在整个集群中复制。当一个新的节点加入后，也会在这个节点上复制一份。
exactly	count	镜像队列将会在集群上复制 count 份。如果集群数量少于 count 时候，队列会复制到所有节点上。如果大于 Count 集群，有一个节点 crash 后，新进入节点也不会做新的镜像。
nodes	node name	镜像队列会在 node name 中复制。如果这个名称不是集群中的一个，这不会触发错误。如果在这个 node list 中没有一个节点在线，那么这个 queue 会被声明在 client 连接的节点。

实例列举：

queue_args("x-ha-policy":"all") // 定义字典来设置额外的队列声明参数
channel.queue_declare(queue="hello-queue",argument=queue_args)

如果需要设定特定的节点（以 rabbit@localhost 为例），再添加一个参数

queue_args("x-ha-policy":"nodes",
           "x-ha-policy-params":["rabbit@localhost"])
channel.queue_declare(queue="hello-queue",argument=queue_args)

可以通过命令行查看那个主节点进行了同步

rabbitmqctl list_queue name slave_pids synchronised_slave_pids

(二）RabbitMQ Cluster 配置

1 单机多节点部署

在启动 RabbitMQ 节点之后，服务器默认的节点名称是 Rabbit 和监听端口 5672，如果想在同一台机器上启动多个节点，那么其他的节点就会因为节点名称和端口与默认的冲突而导致启动失败，可以通过设置环境变量来实现，具体方法如下：

首先在机器上设置两个节点 rabbit 和 rabbit_01

rabbitmqctl stop // 先停止运行节点，再进行集群部署
RABBITMQ_NODE_PORT=5672 RABBITMQ_NODENAME=rabbit // 设置环境变量指定端口和节点名称
rabbitmq-server -detached // 后台启动节点
RABBITMQ_NODE_PORT=5673 RABBITMQ_NODENAME=rabbit_01 // 设置环境变量指定端口和节点名称
rabbitmq-server -detached // 后台启动节点

或者通过添加 /etc/rabbitmq/rabbitmq-env.conf 文件来进行设置：

NODE_PORT=5672
NODENAME=rabbit
NODE_PORT=5673
NODENAME=rabbit_01

将 rabbit_01 节点添加到第一个集群节点 rabbit 中

rabbitmqctl -n rabbit_01@localhost stop_app // 停止 rabbit_01 节点的应用
rabbitmqctl -n rabbit_01@localhost join_cluster rabbit@localhost // 将 rabbit_01 添加到集群节点 rabbit 中去
rabbitmqctl cluster_status // 查看集群节点的状态
rabbitmqctl -n rabbit_01@localhost start_app // 启动 rabbit_01 节点的应用

// 可以看到如下信息，说明节点添加成功，表明都是磁盘类型的节点
Cluster status of node rabbit@localhost ...
[{nodes,[{disc,[rabbit@localhost,rabbit_01@localhost]}]},
 {running_nodes,[rabbit@localhost]},
 {cluster_name,<<"rabbit@localhost">>},
 {partitions,[]},
 {alarms,[{rabbit@localhost,[]}]}]

2 多机多节点部署

不同于单机多节点的情况，在多机环境，如果要在 cluster 集群内部署多个节点，需要注意两个方面：

保证需要部署的这几个节点在同一个局域网内
需要有相同的 Erlang Cookie，否则不能进行通信，为保证 cookie 的完全一致，采用从一个节点 copy 的方式

环境介绍：

RabbitMQ 节点	IP 地址	工作模式	操作系统
rabbitmqCluster	186.16.195.24	DISK	CentOS 7.0 – 64 位
rabbitmqCluster01	186.16.195.25	DISK	CentOS 7.0 – 64 位
rabbitmqCluster02	186.16.195.26	DISK	CentOS 7.0 – 64 位

cluster 部署过程：

局域网配置
分别在三个节点的 /etc/hosts 下设置相同的配置信息

  186.16.195.24 rabbitmqCluster
  186.16.195.25 rabbitmqCluster01
  186.16.195.26 rabbitmqCluster02

设置不同节点间同一认证的 Erlang Cookie
采用从主节点 copy 的方式保持 Cookie 的一致性

[root@rabbitmqCluster01]# scp /var/lib/rabbitmq/.erlang.cookie 186.16.195.25:/var/lib/rabbitmq
[root@rabbitmqCluster02]# scp /var/lib/rabbitmq/.erlang.cookie 186.16.195.26:/var/lib/rabbitmq

使用 -detached 运行各节点

rabbitmqctl stop
rabbitmq-server -detached

查看各节点的状态

[root@rabbitmqCluster]#rabbitmqctl cluster_status
[root@rabbitmqCluster01]#rabbitmqctl cluster_status
[root@rabbitmqCluster02]#rabbitmqctl cluster_status

创建并部署集群，以 rabbitmqCluster01 节点为例：

[root@rabbitmqCluster01]#rabbitmqctl stop_app
[root@rabbitmqCluster01]#rabbitmqctl join_cluster rabbit@rabbitmqCluster
[root@rabbitmqCluster01]#rabbitmqctl start_app

查看集群状态

[root@rabbitmqCluster]#rabbitmqctl cluster_status

RabbitMQ 负载均衡配置

前言：从目前来看，基于 RabbitMQ 的分布式通信框架主要包括两部分内容，一是要确保可用性和性能，另一个就是编写当节点发生故障时知道如何重连到集群的应用程序。负载均衡就是解决处理节点的选择问题。

安装 HAProxy

选择开源的 HAProxy 为 RabbitMQ 集群做负载均衡器，在 CentOS 7.0 中安装 HAProxy。

安装 epel

rpm -ivh http://download.Fedoraproject.org/pub/epel/6/i386/epel-release-6-5.noarch.rpm//

安装 HAProxy

yum -y install haproxy

配置 HAProxy

cp /etc/haproxy/haproxy.cfg /etc/haproxy/haproxy.cfg.bak
vim /etc/haproxy/haproxy.cfg

添加配置信息

listen rabbitmq_local_cluster 127.0.0.1:5670 // 前段 IP，供 product 和 consumer 来进行选择，由于 5672 端口已经默认使用，这里选择 5670 端口
     mode tcp   // 负载均衡选项
     balance roundrobin // 轮询算法将负载发给后台服务器
     server rabbit 127.0.0.1:5672 check inter 5000 rise 2 fall 3// 负载均衡中的集群节点配置，这里选择的 rabbit 节点

  listen private_monitoring :8100
     mode http
     option httplog
     stats enable
     stats uri       /stats
     stats refresh 60s