阿里云-云小站(无限量代金券发放中)
【腾讯云】云服务器、云数据库、COS、CDN、短信等热卖云产品特惠抢购

管理和维护RHCS集群

39次阅读
没有评论

共计 3740 个字符,预计需要花费 10 分钟才能阅读完成。

导读 管理和维护 RHCS 集群是一个非常复杂和繁琐的工作,要维护好一个 RHCS 集群,必须熟悉 RHCS 的基本运行原理,在集群管理方面,RHCS 提供了两种方式:即 Luci 图形界面方式和命令行方式,这儿重点讲述在命令行下如何管理 RHCS 集群。
启动 RHCS 集群

RHCS 集群的核心进程有 cman 和 rgmanager。要启动集群,依次启动 cman, 然后再启动 rgmanager,操作如下:
在主机 web1 上启动集群服务:

[root@web1 ~]# service cman start
Starting cluster:
     Loading modules... done
     Mounting configs... done
     Starting ccsd... done
     Starting cman... done
     Starting qdiskd...done
     Starting daemons...done
     Starting fencing... done
[OK]

等 cman 在其它节点成功启动后,开始启动 rgmanager 服务,具体操作如下:

[root@web1 ~]# service rgmanager start
Starting Cluster Service Manager: [OK]
关闭 RHCS 集群

与启动集群服务器刚好相反,关闭 RHCS 集群的命令如下:

[root@web1 ~]# service rgmanager stop
[root@web1 ~]# service cman stop

有时在关闭 cman 服务时,可能会提示失败,此时可以检查本机的共享存储 GFS2 文件系统是否已经卸载,也可以检查其它节点的 rgmanager 服务是否全部已经正常关闭。

管理应用服务

集群系统启动后,默认自动启动应用服务,但是,如果某个应用服务没有自动启动,就需要手动来启动。管理应用服务的命令是 clusvcadm,通过这些命令可以启动、关闭、重启、切换集群服务中德尔应用服务。

启动某个应用程序

可以通过以下方式启动某个节点上的应用服务,以启动 wrbserver 为例:

[root@web1 ~]#clusvcadm -e webserver -m web1
Member web1 trying to enable service:webserver...Success
service:webserver is now running on web1
关闭某个应用程序

可以通过以下方式关闭某个节点上的应用服务,以启动 mysqlserver 为例:

[root@mysql1 ~]#clusvcadm -s mysqlserver -m web1
Member mysql1 stopping service:mysqlserver...Success
重启某个应用程序

可以通过以下方式重启某个节点上的应用服务,以启动 wrbserver 为例:

[root@web2 ~]#clusvcadm -R wrbserver -m web1
Member web1 trying to restart service:wrbserver...Success

这个命令是在 web2 节点上执行的,也能将 web1 节点上的 wrbserver 进行重启,由此可知,clusvcadm 命令可以在集群任意节点上执行都是可以的。

切换某个应用程序

可以通过以下方式切换某个节点上的应用服务,以在节点 web1 的服务切换到节点 web2 上为例:

[root@web1 ~]# clusvcadm -r wrbserver -m web2
Trying to relocate service:webserver to web2...Success
service:webserver is now running on web2
监控 RHCS 集群状态

通过对 RHCS 的监控,有助于了解集群每个节点的健康状态,发现问题并及时解决问题。RHCS 集群提供了丰富的状态查看命令,这里主要介绍 cman_tool、clustat、ccs_tool 的使用方法。

cman_tool 命令

cman_tool 参数比较多,但使用方法比较简单,这儿介绍两个参数的使用方法:

[root@web1 ~]# cman_tool  nodes -a
Node  Sts   Inc   Joined               Name
   0   M      0   2010-08-23 01:24:00  /dev/sdb7
   1   M   2492   2010-08-23 01:22:43  web2
       Addresses: 192.168.12.240 
   2   M   2492   2010-08-23 01:22:43  Mysql1
       Addresses: 192.168.12.231 
   3   M   2492   2010-08-23 01:22:43  Mysql2
       Addresses: 192.168.12.232 
   4   M   2488   2010-08-23 01:22:43  web1
       Addresses: 192.168.12.230

此命令显示了节点名称,以及对应的节点 IP 地址和加入集群的时间。
如果要了解更多集群节点信息,可以通过如下命令:

[root@web1 ~]# cman_tool   status
Version: 6.2.0
Config Version: 35  #集群配置文件版本号
Cluster Name: mycluster   #集群名称
Cluster Id: 56756
Cluster Member: Yes
Cluster Generation: 2764
Membership state: Cluster-Member
Nodes: 4   #集群节点数
Expected votes: 6   #期望的投票数
Quorum device votes: 2   #表决磁盘投票值
Total votes: 6   #集群中所有投票值大小
Quorum: 4 #集群法定投票值,低于这个值,集群将停止服务
Active subsystems: 9 
Flags: Dirty 
Ports Bound: 0 177  
Node name: web1
Node ID: 4  #本节点在集群中的 ID 号
Multicast addresses: 239.192.221.146 #集群广播地址 
Node addresses: 192.168.12.230 #本节点对应的 IP 地址 
clustat 命令

clustat 命令使用非常简单,详细的使用方法可以通过“clustat -h”获取帮助信息,这里仅仅列举几个例子。

[root@web1 ~]#clustat  -i 3
Cluster Status for mycluster @ Mon Aug 23 18:54:15 2010
Member Status: Quorate
Member Name              ID                        Status
 ------ ----            ----                       ------
 web2                     1                    Online, rgmanager
 Mysql1                   2                    Online, rgmanager
 Mysql2                   3                    Online, rgmanager
 web1                     4                    Online, Local, rgmanager
 /dev/sdb7                0                    Online, Quorum Disk
 Service Name             Owner (Last)         State         
 ------- ----             ----- ------         --------         
 service:mysqlserver      Mysql1               started       
 service:webserver        web1                 started

对输出内容含义如下:
clustat 的“-i”参数可以实时的显示集群系统中每个节点以及服务的运行状态,“-i 3”表示每三秒刷新一次集群状态。
在这个输出中,可以看到每个节点都处于“Online”状态,表明每个节点都运行正常,如果某个节点退出了集群,对应的状态应该是“Offline”,同时还可以看到,集群的两个服务也处于“started”状态,分别运行在 Mysql1 节点和 web1 节点。
另外,通过“ID”一列可以知道集群节点的对应关系,例如,web2 在此集群中对应的就是“Node 1”节点,同理,web1 对应的是“Node 4”节点。了解集群节点顺序有助于对集群日志的解读。

ccs_tool 命令

ccs_tool 主要用来管理集群配置文件 cluster.conf,通过 ccs_tool 可以在集群中增加 / 删除节点、增加 / 删除 fence 设备、更新集群配置文件等操作。
下面是 ccs_tool 的几个应用实例:
当在一个节点修改完配置文件后,可以执行“ccs_tool update”指令将配置文件在所有节点进行更新,例如:

[root@web1 cluster]# ccs_tool  update /etc/cluster/cluster.conf
Proposed updated config file does not have greater version number.
  Current config_version :: 35
  Proposed config_version:: 35
Failed to update config file.

ccs_tool 是根据 cluster.conf 中的“config_version”值来决定是否进行更新的,因此在修改完 cluster.conf 文件后,一定要将 cluster.conf 的 config_version 值进行更新,这样执行 ccs_tool 时才能更新配置文件。

[root@web1 cluster]# ccs_tool  update /etc/cluster/cluster.conf
Config file updated from version 35 to 36
Update complete.

正文完
星哥说事-微信公众号
post-qrcode
 0
星锅
版权声明:本站原创文章,由 星锅 于2024-07-24发表,共计3740字。
转载说明:除特殊说明外本站文章皆由CC-4.0协议发布,转载请注明出处。
【腾讯云】推广者专属福利,新客户无门槛领取总价值高达2860元代金券,每种代金券限量500张,先到先得。
阿里云-最新活动爆款每日限量供应
评论(没有评论)
验证码
【腾讯云】云服务器、云数据库、COS、CDN、短信等云产品特惠热卖中