阿里云-云小站(无限量代金券发放中)
【腾讯云】云服务器、云数据库、COS、CDN、短信等热卖云产品特惠抢购

CentOS 7.5数据库架构之NFS+Heartbeat+DRBD实测

275次阅读
没有评论

共计 15770 个字符,预计需要花费 40 分钟才能阅读完成。

理论概述

本案例只是,为搭建 MySQL 集群做准备,并无 MySQL

DRBD

DRBD(distributed replicated block device 分布式复制块设备)是一个基于软件实现的、无共享的、服务器之间镜像块设备内容的存储复制解决方案。DRBD 是镜像块设备,是按数据位镜像成一样的数据块

DRBD 可以部署在如下类的底层设备上:1、一个磁盘,或者是磁盘的某一个分区;2、一个 soft raid 设备;3、一个 LVM 的逻辑卷;4、一个 EVMS(Enterprise Volume Management System,企业卷管理系统)的卷;5、其他任何的块设备。

工作原理

CentOS 7.5 数据库架构之 NFS+Heartbeat+DRBD 实测

DRBD 需要运行在各个节点上,且是运行在节点主机的内核中,所以 DRBD 是内核模块,在 Linux2.6.33 版本起开始整合进内核。

DRBD 工作的位置在文件系统的 buffer Cache 和磁盘调度器之间

如上图左节点为活跃节点实线箭头,有节点为备用节点虚线箭头。左节点接收到数据法网内核的数据通路,DRBD 在数据通路中注册钩子检查数据(类似 ipvs)当检测到接收的数据是发往自己管理的存储位置,程序会复制另一份,一份存储到本机的 DRBD 存储设备,另一份就发给 TCP/IP 协议栈,通过网络传输到另一台节点上 TCP/IP 协议栈;另一台节点上运行的 DRBD 模块同样在数据通路上监测数据,当检测到传输过来的数据时,运行存储机制,存储到本机 DRBD 存储设备的对应位置。

如果左节点宕机,在高可用集群中右节点成为活跃节点,并且会接收到左节点宕机的信号,接受数据先保存到本地,左节点恢复上线之后,再把左节点宕机后右节点变动的 数据镜像到左节点。每个设备(drbd 提供了不止一个设备)都有一个状态,可能是‘主’状态或‘从’态。在主节点上,应用程序应能运行和访问 drbd 设备(/dev/drbd)。每次写入会发往本地磁盘设备和从节点设备中。从节点只能简单地把数据写入它的磁盘设上。读取数据通常在本地进行。如果主节点发生故障,心跳(heartbeat 或 corosync)将会把从节点转换到主状态,并启动其上的应用程序。(如果您将它和无日志 FS 一起使用,则需要运行 fsck)。如果发生故障的节点恢复工作,它就会成为新的从节点,而且必须使自己的内容与主节点的内容保持同步。

复制模式 镜像过程完成之后还需要返回成功或失败的回应信息。回应信息可以在传输过程中的不同位置返回,如上图 A /B/ C 三处,可以分为三种复制模式:

特点:实时复制:一段修改之后马上复制过去 透明的传输:程序不需要检测到这个数据存储在多个主机上 同步或者异步:同步镜像:程序写操作完成后会通知所有已经连接的主机;异步同步:程序会在本地写完之前通知其它的主机。

A: 一旦本地磁盘写入已经完成,数据包已在发送队列中,则写操作被认为是完成的。在一个节点发生故障时,可能发生数据丢失,因为被写入到远程节点上的数据可能仍在发送队列。尽管,在故障转移节点上的数据是一致的,但没有及时更新。这通常是用于地理上分开的节点。B: 一旦本地磁盘写入已完成且复制数据包达到了对等节点则认为写操作在主节点上被认为是完成的。数据丢失可能发生在参加的两个节点同时故障的情况下,因为在飞行中的数据可能不会被提交到磁盘。C: 只有在本地和远程节点的磁盘已经确认了写操作完成,写才被认为完成。没有任何数据丢失,所以这是一个群集节点的流行模式,但 I / O 吞吐量依赖于网络带宽。A 数据一旦写入磁盘并发送到网络中就认为完成了写入操作。B 收到接收确认就认为完成了写入操作。C 收到写入确认就认为完成了写入操作。就目前而言应用最多和应用最广泛的为协议 C。

架构

MySQL+heartbeat+drbd+lvs 是一套成熟的集群解决方案在现在多数企业里面,通过 heartbeat+DRBD 完成 MySQL 的主节点写操作的高可用性,通过 MySQL+lvs 实现 MySQL 数据库的主从复制和 MySQL 读写的负载均衡。这个方案在读写方面进行了分离,融合了写操作的高可用和读操作的负载均衡。

NFS

NFS 作为业界常用的共享存储方案,被众多公司采用。使用 NFS 作为共享存储,为前端 WEB server 提供服务,主要存储网页代码以及其他文件。

  • 常用同步技术
  1. rsync+inotify 实现文件同步
  2. 借助 DRBD,实现文件同步
    但是以上方案都没有实现高可用,只是实现了两者数据同步。但是业务要求 NFS 服务器必须是高可用,所以我们在第二种同步方案的基础上,在结合 heartbeat 来实现高可用。

架构部署

采用 MySQL 读写分离的方案;而读写之间的数据同步采用 MySQL 的单项或者双向复制技术实现。MySQL 写操作采用基于 heartbeat+DRBD+MySQL 搭建高可用集群;读操作普遍采用基于 LVS+keepalived 搭建高可用扩展集群方案

本案例中暂时没部署 MySQL,实现思路:dbmaster 和 dbbackup 两台机器,分别安装 nfs,heartbeat,dbmaster,DRBD。

  • nfs 可以另找一台服务器搭建专门用为共享存储。
  • nfs 的控制权交给了 heartbeat。

架构拓扑

CentOS 7.5 数据库架构之 NFS+Heartbeat+DRBD 实测

环境 全部都是 CentOS 7.5 系统
主机名 |IP| 担任角色
–|–|–
dbmaster|192.168.111.3|drbd 主,nfs server,heartbeat 主
dbbackup|192.168.111.4|drbd 被,heartbeat 被
VIP|192.168.111.100
nfs 客户端 |192.168.111.5| 挂载 VIP 共享的目录测试

部署 DRBD

  1. 所有主机配置 hosts 并且改为对应的主机名
  2. 所有主机保持网络状况的良好通信
  3. 所有主机安装最新的 epel 源
  4. DRBD 这两台各自分别添加了 1GB 硬盘供 DRBD 使用
  5. 同步时间
[root@localhost ~]# vim /etc/hosts
    192.168.111.7 lvsmaster       
    192.168.111.8 lvsbackup
    192.168.111.3 dbmaster
    192.168.111.4 dbbackup
    192.168.111.5 dbslave1
    192.168.111.6 dbslave2

[root@dbmaster yum.repos.d]# uname -r
3.10.0-862.el7.x86_64
#这是旧的

[root@dbbackup ~]# yum install kernel* -y

[root@dbbackup ~]# reboot

[root@localhost ~]# uname -r
3.10.0-957.12.1.el7.x86_64
#这是新的


drbd                  397041  0 
libcrc32c              12644  4 xfs,drbd,nf_nat,nf_conntrack    
[root@dbbackup ~]# yum install https://www.elrepo.org/elrepo-release-7.0-3.el7.elrepo.noarch.rpm -y

[root@dbbackup ~]# yum -y install drbd84-utils kmod-drbd84
#安装 DRBD
[root@localhost ~]# modprobe drbd
#不出意外这样就 OK 了
[root@localhost ~]# lsmod |grep -i drbd
  • 分区
[root@localhost ~]# fdisk /dev/sdb 
欢迎使用 fdisk (util-linux 2.23.2)。更改将停留在内存中,直到您决定将更改写入磁盘。使用写入命令前请三思。Device does not contain a recognized partition table
使用磁盘标识符 0x7ce5781e 创建新的 DOS 磁盘标签。命令(输入 m 获取帮助):n
Partition type:
   p   primary (0 primary, 0 extended, 4 free)
   e   extended
Select (default p): p
分区号 (1-4,默认 1):起始 扇区 (2048-2097151,默认为 2048):将使用默认值 2048
Last 扇区, + 扇区 or +size{K,M,G} (2048-2097151,默认为 2097151):将使用默认值 2097151
分区 1 已设置为 Linux 类型,大小设为 1023 MiB

命令(输入 m 获取帮助):w
The partition table has been altered!

Calling ioctl() to re-read partition table.
正在同步磁盘。#以上关于 DRBD 和分区的操作在 111.3 和 111.4 机器上重复操作,master 和 backup 分区大小一致。
  • 修改配置文件
[root@dbmaster ~]# vim /etc/drbd.conf 
#include "drbd.d/global_common.conf"; 
#注释掉这行,避免和我们自己写的配置产生冲突。include "drbd.d/*.res";
    include "drbd.d/*.cfg";
[root@localhost ~]# vim /etc/drbd.d/drbd_basic.cfg 
    global {
        usage-count yes;
        #是否参与 DRBD 使用者统计,默认为 yes,yes or no 都无所谓 
    }
    common {syncer { rate 30M;}
    }
    #设置主备节点同步的网络速率最大值,默认单位是字节,我们可以设定为兆
    resource r0 {
    #r0 为资源名,我们在初始化磁盘的时候就可以使用资源名来初始化。protocol C;
        #使用 C 协议。handlers {
            pri-on-incon-degr "echo o > /proc/sysrq-trigger ; halt -f";  
            pri-lost-after-sb "echo o > /proc/sysrq-trigger ; halt";
            local-io-error "echo o > /proc/sysrq-trigger ; halt -f";
            fence-peer "/usr/lib4/heartbeat/drbd-peer-outdater -t 5";
            pri-lost "echo pri-lst. Have a look at the log file.mail -s'Drbd Alert'root";
            split-brain "/usr/lib/drbd/notify-split-brain.sh root";
            out-of-sync "/usr/lib/drbd/notify-out-of-sync.sh root";
    }
        net {
          cram-hmac-alg "sha1";
          shared-secret "MySQL-HA";
          #drbd 同步时使用的验证方式和密码信息
    }
        disk {
          on-io-error detach;
          fencing resource-only;
          # 使用 DOPD(drbd outdate-peer deamon)功能保证数据不同步的时候不进行切换。}
        startup {
          wfc-timeout 120;
          degr-wfc-timeout 120;
    }
        device /dev/drbd0;
        #这里 /dev/drbd0 是用户挂载时的设备名字,由 DRBD 进程创建
        on dbmaster {
        #每个主机名的说明以 on 开头,后面是 hostname(必须在 /etc/hosts 可解析)disk /dev/sdb1;
          #使用这个磁盘作为 drbd 的磁盘 /dev/drbd0。address 192.168.111.3:7788;
          #设置 DRBD 的监听端口,用于与另一台主机通信
          meta-disk internal;
          #drbd 的元数据存放方式
    }
        on dbbackup {
          disk /dev/sdb1;
          address 192.168.111.4:7788;
          meta-disk internal;
    }
    }
  • drbd 报错
[root@dbmaster ~]# drbdadm create-md r0
WARN:
  You are using the 'drbd-peer-outdater' as fence-peer program.
  If you use that mechanism the dopd heartbeat plugin program needs
  to be able to call drbdsetup and drbdmeta with root privileges.

  You need to fix this with these commands:
  chgrp haclient /lib/drbd/drbdsetup-84
  chmod o-x /lib/drbd/drbdsetup-84
  chmod u+s /lib/drbd/drbdsetup-84

  chgrp haclient /usr/sbin/drbdmeta
  chmod o-x /usr/sbin/drbdmeta
  chmod u+s /usr/sbin/drbdmeta

md_offset 1072689152
al_offset 1072656384
bm_offset 1072623616

Found xfs filesystem
     1047552 kB data area apparently used
     1047484 kB left usable by current configuration

Device size would be truncated, which
would corrupt data and result in
'access beyond end of device' errors.
You need to either
   * use external meta data (recommended)
   * shrink that filesystem first
   * zero out the device (destroy the filesystem)
Operation refused.

Command 'drbdmeta 0 v08 /dev/sdb1 internal create-md' terminated with exit code 40

应该是该分区有残留的文件

  • 解决
[root@dbmaster ~]# dd if=/dev/zero of=/dev/sdb1 bs=1M count=1
记录了 1 +0 的读入
记录了 1 +0 的写出
1048576 字节 (1.0 MB) 已复制,0.00339429 秒,309 MB/ 秒
[root@dbmaster ~]# drbdadm create-md r0
  --==  Thank you for participating in the global usage survey  ==--
The server's response is:

you are the 14097th user to install this version
WARN:
  You are using the 'drbd-peer-outdater' as fence-peer program.
  If you use that mechanism the dopd heartbeat plugin program needs
  to be able to call drbdsetup and drbdmeta with root privileges.

  You need to fix this with these commands:
  chgrp haclient /lib/drbd/drbdsetup-84
  chmod o-x /lib/drbd/drbdsetup-84
  chmod u+s /lib/drbd/drbdsetup-84

  chgrp haclient /usr/sbin/drbdmeta
  chmod o-x /usr/sbin/drbdmeta
  chmod u+s /usr/sbin/drbdmeta

initializing activity log
initializing bitmap (32 KB) to all zero
Writing meta data...
New drbd meta data block successfully created.
success
#使用 dd 命令清空,然后再执行
  • 进一步配置
[root@dbmaster ~]# systemctl start drbd.service
[root@dbbackup ~]# systemctl enable drbd.service 
#启动服务

#如报错,试试如下,不报错跳过这步
[root@dbmaster ~]# groupadd haclient
[root@dbmaster ~]# chgrp haclient /lib/drbd/drbdsetup-84
[root@dbmaster ~]# chmod o-x /lib/drbd/drbdsetup-84
[root@dbmaster ~]# chmod u+s /lib/drbd/drbdsetup-84
[root@dbmaster ~]# chgrp haclient /usr/sbin/drbdmeta
[root@dbmaster ~]# chmod o-x /usr/sbin/drbdmeta
[root@dbmaster ~]# chmod u+s /usr/sbin/drbdmeta
#以上这几个操作,找了很多资料都没有提到要做,还特意提醒不用做,可能环境不同吧,不做一直报错

[root@dbmaster ~]# drbdadm primary --force r0
#主上操作
[root@dbmaster ~]# drbdadm role r0
Primary/Secondary
#查看状态

[root@dbbackup ~]# drbdadm role r0
Secondary/Primary
#backup 机器查看状态

[root@dbbackup ~]# drbdadm dstate r0
UpToDate/UpToDate
#查看数据同步状态,如上为一致,还有 Inconsistent 状态为数据不一致正在同步
  • 挂载 DRBD 磁盘
现在 dbmaster 上操作
[root@dbmaster ~]# mkfs.ext4 /dev/drbd0 
mke2fs 1.42.9 (28-Dec-2013)
文件系统标签 =
OS type: Linux
块大小 =4096 (log=2)
分块大小 =4096 (log=2)
Stride=0 blocks, Stripe width=0 blocks
65536 inodes, 261871 blocks
13093 blocks (5.00%) reserved for the super user
第一个数据块 =0
Maximum filesystem blocks=268435456
8 block groups
32768 blocks per group, 32768 fragments per group
8192 inodes per group
Superblock backups stored on blocks: 
    32768, 98304, 163840, 229376

Allocating group tables: 完成                            
正在写入 inode 表: 完成                            
Creating journal (4096 blocks): 完成
Writing superblocks and filesystem accounting information: 完成


[root@dbmaster ~]# mkdir /nfs
[root@dbmaster ~]# mount /dev/drbd0 /nfs




现在是 dbbackup 上操作,主要是检测备端是否能够正常挂载和使用:[root@dbmaster ~]# umount /nfs
#主上将设备卸载
[root@dbmaster ~]# drbdadm secondary all
#切换为被状态

[root@dbbackup ~]# drbdadm primary r0
#被设为主状态
[root@dbbackup ~]# mkdir /nfs
[root@dbbackup ~]# mount /dev/drbd0 /nfs

[root@dbbackup ~]# df -Th
文件系统                类型      容量  已用  可用 已用 % 挂载点
/dev/mapper/centos-root xfs        17G  4.5G   13G   27% /
devtmpfs                devtmpfs  470M     0  470M    0% /dev
tmpfs                   tmpfs     487M     0  487M    0% /dev/shm
tmpfs                   tmpfs     487M   14M  473M    3% /run
tmpfs                   tmpfs     487M     0  487M    0% /sys/fs/cgroup
/dev/sr0                iso9660   4.2G  4.2G     0  100% /media/cdrom
/dev/sda1               xfs      1014M  251M  764M   25% /boot
tmpfs                   tmpfs      98M     0   98M    0% /run/user/0
/dev/drbd0              ext4      991M  2.6M  922M    1% /database

再按相同的方法将状态切换回来

好的,这下简单测试了下,先告一段落

部署 heartbeat

  • 安装 cluster-glue

[root@dbmaster ~]# ssh-keygen -q -t rsa -N '' -f ~/.ssh/id_rsa
[root@dbmaster ~]# ssh-copy-id root@dbbackup
#ssh 免密认证

[root@dbbackup ~]# yum install gcc gcc-c++ autoconf automake libtool glib2-devel libxml2-devel bzip2 bzip2-devel e2fsprogs-devel libxslt-devel libtool-ltdl-devel asciidoc -y
#两机同样操作安装依赖

[root@dbbackup ~]# useradd -g haclient hacluster

安装包下载
下载软件包:Reusable-Components-glue、resource-agents、heartbeat
免费下载地址在 http://linux.linuxidc.com/
用户名与密码都是 www.linuxidc.com
具体下载目录在 /2019 年资料 / 2 月 /26 日 /CentOS 7 下安装配置 Heartbeat 高可用集群 /
下载方法见 http://www.linuxidc.com/Linux/2013-07/87684.htm

[root@dbmaster ~]# tar -jxvf glue.tar.bz2 
#我这是改名之后的,原来的是一串数字
[root@dbmaster ~]# cd Reusable-Cluster-Components-glue--0a7add1d9996/
[root@dbmaster Reusable-Cluster-Components-glue--0a7add1d9996]# ./autogen.sh
./configure --prefix=/usr/local/heartbeat --with-daemon-user=hacluster --with-daemon-group=haclient --enable-fatal-warnings=no LIBS='/lib64/libuuid.so.1'
make && make install
echo $?
cd ..
  • 安装 resource-agents

[root@dbbackup ~]# tar zxf resource-agents-3.9.6.tar.gz 
[root@dbbackup ~]# cd resource-agents-3.9.6/
./autogen.sh 
./configure --prefix=/usr/local/heartbeat --with-daemon-user=hacluster --with-daemon-group=haclient --enable-fatal-warnings=no LIBS='/lib64/libuuid.so.1'
make && make install
echo $?
cd ..
  • 安装 heartbeat

[root@dbmaster ~]# tar jxf heartbeat.bz2 
#该名称是我后来改过的
[root@dbmaster ~]# cd Heartbeat-3-0-958e11be8686/

./bootstrap
export CFLAGS="$CFLAGS -I/usr/local/heartbeat/include -L/usr/local/heartbeat/lib"
./configure --prefix=/usr/local/heartbeat --with-daemon-user=hacluster --with-daemon-group=haclient --enable-fatal-warnings=no LIBS='/lib64/libuuid.so.1'
make && make install
echo $?

[root@dbbackup ~]# mkdir -pv /usr/local/heartbeat/usr/lib/ocf/lib/heartbeat/
[root@dbbackup ~]# cp /usr/lib/ocf/lib/heartbeat/ocf-* /usr/local/heartbeat/usr/lib/ocf/lib/heartbeat/

[root@dbmaster ~]# cp Heartbeat-3-0-958e11be8686/doc/{ha.cf,haresources,authkeys} /usr/local/heartbeat/etc/ha.d/
#拷贝配置文件

[root@dbmaster Heartbeat-3-0-958e11be8686]# chmod 600 /usr/local/heartbeat/etc/ha.d/authkeys 
#该权限必须为 600
#以上安装两台机器一样
  • 配置文件
[root@dbmaster ~]# vim /usr/local/heartbeat/etc/ha.d/haresources
#末尾添加如下
dbmaster IPaddr::192.168.111.100/24/ens32 drbddisk::r0 Filesystem::/dev/drbd0::/nfs::ext4 killnfsd
#dbmaster IPaddr::192.168.111.10/24/ens32 主机名 后跟虚拟 IP 地址、接口
#drbddisk::r0 管理 drbd 资源的名称
#Filesystem::/dev/drbd0::/nfs::ext4 renfsd 文件系统:: 挂载的目录及格式:: 后跟 renfsd 资源脚本

[root@dbmaster ~]# cp /etc/ha.d/resource.d/drbddisk /usr/local/heartbeat/etc/ha.d/resource.d/
#两台一样

[root@dbmaster ~]# echo "pkill -9 nfs; systemctl restart nfs; exit 0" > /usr/local/heartbeat/etc/ha.d/resource.d/killnfsd
#编辑 nfs 脚本文件 killnfsd,killnfsd 脚本文件的作用,#drbd 主备切换时,若 nfs 没有启动,则此脚本会把 nfs 启动
#drbd 主备切换时,若 nfs 已启动,则此脚本会重启 nfs 服务,因为 NFS 服务切换后,必须重新 mount 一下 nfs 共享出来的目录,否则会出现 stale NFS file handle 的错误

[root@dbmaster ~]# chmod +x /usr/local/heartbeat/etc/ha.d/resource.d/drbddisk
[root@dbmaster ~]# chmod +x /usr/local/heartbeat/etc/ha.d/resource.d/killnfsd 



[root@dbmaster resource.d]# pwd
/usr/local/heartbeat/etc/ha.d/resource.d
[root@dbmaster resource.d]#  ll drbddisk Filesystem killnfsd IPaddr 
-rwxr-xr-x 1 root root 3162 5 月  14 15:43 drbddisk
-rwxr-xr-x 1 root root 1923 5 月  14 10:15 Filesystem
-rwxr-xr-x 1 root root 2297 5 月  14 10:15 IPaddr
-rwxr-xr-x 1 root root   57 5 月  14 15:41 killnfsd
#必须要有这四个脚本,有的是自带,有的是复制,有的自己写,上面已经说明而且必须要有执行权限。

[root@dbmaster ~]# vim  /usr/local/heartbeat/etc/ha.d/ha.cf
#修改主配置文件(去掉注释或修改值)logfile /var/log/ha-log
#指定 heartbeat 日志文件的位置
logfacility     local0
#利用系统日志打印日志
keepalive 1
# 心跳发送时间间隔
deadtime 5
 # 备用节点 5s 内没有检测到 master 机的心跳,确认对方故障
warntime 2
# 警告 2 次
initdead 10
# 守护进程启动 30s 后,启动服务资源。udpport 694
#设定集群节点间的通信协议及端口为 udp694 监听端口(该端口可以修改)ucast ens32 192.168.111.4
# 另一台主机节点 eth0 的地址,注意是另一台。auto_failback off
#当 primary 节点切换到 secondary 节点之后,primary 节点恢复正常,不进行切回操作,因为切换一次 mysql master 成本很高。node    dbmaster
node    dbbackup
# 定义两个节点的主机名,一行写一个。ping 192.168.111.2
#两个 IP 的网关
respawn hacluster /usr/local/heartbeat/libexec/heartbeat/ipfail 
#使用这个脚本去侦听对方是否还活着(使用的是 ICMP 报文检测)[root@dbmaster ~]# vim /usr/local/heartbeat/etc/ha.d/authkeys
#认证文件
    auth 1
    #表示使用 id 为 2 的验证 下边需要定义一个 2 的验证算法
    1 sha1 HA_DB
    #口令(HISHA1)随便给 主从配置相同即可

dbdackup 也是同样的安装方法,配置文件直接 scp 过去就可以了,然后修改

[root@dbmaster ~]# scp -r /usr/local/heartbeat/etc/ha.d/{authkeys,haresources,ha.cf} root@dbbackup:/usr/local/heartbeat/etc/ha.d/
[root@dbbackup ha.d]# vim /usr/local/heartbeat/etc/ha.d/ha.cf 
ucast ens32 192.168.111.3
#把 backup 节点上 ha.cf 配置文件中 ucast 中 IP 改为对方

[root@dbmaster ~]# ln -svf /usr/local/heartbeat/lib64/heartbeat/plugins/RAExec/* /usr/local/heartbeat/lib/heartbeat/plugins/RAExec/

[root@dbmaster ~]# ln -svf /usr/local/heartbeat/lib64/heartbeat/plugins/* /usr/local/heartbeat/lib/heartbeat/plugins/
#2 机器将这些库文件链接过去,要不启动报错
May 13 13:09:27 dbmaster heartbeat: [86183]: ERROR: Illegal directive [ucast] in /usr/local/heartbeat/etc/ha.d/ha.cf

部署 NFS 及配合 heartbeat

[root@dbbackup ~]# yum -y install  nfs-utils nfs-utils-lib nfs4-acl-tools
#dbmaster 和 dbbackup 安装
[root@dbmaster ~]# vim /etc/exports
    /nfs    192.168.111.0/255.255.255.0(rw,sync,no_root_squash)
#设置 nfs 共享目录,权限,网段
[root@dbmaster ~]# systemctl restart rpcbind

#启动顺序一定是 rpcbind->nfs,否则有可能出现错误
#在这里 nfs 不需要启动,它由 heartbeat 控制

[root@dbmaster ~]# systemctl start heartbeat
[root@dbmaster ~]# systemctl enable heartbeat
#最多等一两分钟 VIP 肯定出来,否则查看日志
[root@dbmaster ~]# ip a | grep inet
#主上查看
    inet 127.0.0.1/8 scope host lo
    inet6 ::1/128 scope host 
    inet 192.168.111.3/24 brd 192.168.111.255 scope global noprefixroute ens32
    inet 192.168.111.100/24 brd 192.168.111.255 scope global secondary ens32:0
#到了这,VIP 肯定要出来,可以稍等会,观察下日志。如果出错,上面可能哪一步没有到位
[root@dbmaster ~]# mount | grep drbd
/dev/drbd0 on /nfs type ext4 (rw,relatime,data=ordered)
#这个也已经根据配置自动挂载

[root@dbbackup ~]# showmount -e 192.168.111.100
Export list for 192.168.111.100:
/nfs 192.168.111.0/255.255.255.0
#查看 VIP 共享的目录
  • 配置 nfs 自动挂载
[root@localhost ~]# mkdir /nfs
[root@localhost ~]# mount 192.168.111.100:/nfs/ /nfs/
#客户端测试
[root@localhost ~]# echo "192.168.111.100:/nfs /nfs nfs defaults,soft,intr 0 0" >> /etc/fstab 
[root@localhost ~]# tail -1 /etc/fstab 
192.168.111.100:/nfs /nfs nfs defaults,soft,intr 0 0
#Nfs 是类型
#soft 参数是为了向用户输出错误信息
#intr 参数为了解决当网络出现故障时,我们可以通过按下 ctrl+ c 组合键来终止操作
  • 验证:接下来我们在主上把 nfs 服务关掉,模拟故障,看 VIP 是否切换主机
[root@dbmaster ~]# systemctl stop nfs
[root@dbmaster ~]# systemctl status nfs
● nfs-server.service - NFS server and services
   Loaded: loaded (/usr/lib/systemd/system/nfs-server.service; disabled; vendor preset: disabled)
  Drop-In: /run/systemd/generator/nfs-server.service.d
           └─order-with-mounts.conf
   Active: inactive (dead) since 二 2019-05-14 18:21:09 CST; 6s ago
  Process: 61802 ExecStopPost=/usr/sbin/exportfs -f (code=exited, status=0/SUCCESS)
  Process: 61799 ExecStopPost=/usr/sbin/exportfs -au (code=exited, status=0/SUCCESS)
  Process: 61797 ExecStop=/usr/sbin/rpc.nfsd 0 (code=exited, status=0/SUCCESS)
 Main PID: 60625 (code=exited, status=0/SUCCESS)

5 月 14 16:35:58 dbmaster systemd[1]: Starting NFS server and services...
5 月 14 16:35:58 dbmaster systemd[1]: Started NFS server and services.
5 月 14 18:21:09 dbmaster systemd[1]: Stopping NFS server and services...
5 月 14 18:21:09 dbmaster systemd[1]: Stopped NFS server and services.

我在主被两台机器上查看 debug 日志,没有任何变动

[root@dbbackup ~]# cd /nfs

#我在挂载了 VIP 的机器上查看共享目录能否使用,卡死终端

总结下原因:heartbeat 没有监控到 nfs 的服务状态,它自身想当然的认为,只有 heartbeat 服务出故障,才切 VIP。

解决:我们将 nfs,和 heartbeat 服务做一个捆绑,类似于事物性质。即 nfs 出问题,heartbeat 也要宕掉。这里通过脚本实现。

[root@dbmaster ~]# vim /opt/monitornfs.sh

while true
do
    drbdstatus=`cat /proc/drbd 2> /dev/null  | grep ro | tail -n1 | awk -F':' '{print $4}' | awk -F'/' '{print $1}'`
    nfsstatus=`systemctl status nfs&>/dev/null ; echo $?`

    if [-z  $drbdstatus];then
        sleep 10
        continue
    elif [$drbdstatus == 'Primary'];then
        if [$nfsstatus -ne 0];then
            systemctl start nfs &> /dev/null
            newnfsstatus=`systemctl status nfs&>/dev/null ; echo $?`
            if [$newnfsstatus -ne 0];then
            systemctl stop heartbeat
            #尝试开启之后若还是不行, 则关掉 heartbeat
            fi
        fi
    fi
    sleep 5
done

[root@dbmaster ~]# chmod +x /opt/monitornfs.sh 
[root@dbmaster ~]# nohup /opt/monitornfs.sh &
#以上关于脚本操作,在 dbbackup 上重复
  • 测试
[root@dbmaster ~]# systemctl stop nfs
#主节点关掉 nfs 服务

#但是后台的脚本又给他开启了
[root@dbmaster ~]# systemctl stop heartbeat
#VIP 切换到备机了

但是 nfs 客户端的使用并不影响,切换的时候会有轻微的延迟。

nfs 切记要挂载到别的机器上不要为了省事,省机器

正文完
星哥玩云-微信公众号
post-qrcode
 0
星锅
版权声明:本站原创文章,由 星锅 于2022-01-21发表,共计15770字。
转载说明:除特殊说明外本站文章皆由CC-4.0协议发布,转载请注明出处。
【腾讯云】推广者专属福利,新客户无门槛领取总价值高达2860元代金券,每种代金券限量500张,先到先得。
阿里云-最新活动爆款每日限量供应
评论(没有评论)
验证码
【腾讯云】云服务器、云数据库、COS、CDN、短信等云产品特惠热卖中