共计 5009 个字符,预计需要花费 13 分钟才能阅读完成。
前言
首先,还是先提一下我使用数据同步的一个背景:
公司的电脑是 windows 7 系统,一般程序开发在本地机器进行,代码开发完之后,需要同步到远程 linux 编译机上编译。
之前使用 eclipse 时的同步方案:通过 samba 将 linux 主机的项目目录映射到 windows 主机的一个系统盘 J 上,然后通过一个 eclipse 的数据同步插件将本地项目目录同步到系统盘 J 上。
后面通过 Babun(《在 Windows 上使用 Babun 进行 Linux 开发工作》)用上 vim 之后,没有找到数据同步的 vim 插件,于是需要寻找其他数据同步的方案。
为什么不直接在 samba 映射的目录下进行开发呢?
- 开发目录的读写、变动比较大,直接在该目录下开发的话,由于网络原因,速度非常慢,经常出现卡死的情况。
- 映射过来的目录是编译机上的目录,存在许多编译产生的中间文件,这些文件对开发目录来说是一个很大的负担。
总结以上,我需要的是以下的一个同步机制:
- 开发目录与编译目录独立(也就是不能直接在 samba 映射的目录下开发);
- 开发目录的变动同步到编译目录,而编译目录的变动不会同步带开发目录,即单向同步。
rsync
rsync,remote synchronize。顾名思意,它是一款实现远程同步功能的软件,它在同步文件的同时,可以保持原来文件的权限、时间、软硬链接等附加信息。rsync 是用“rsync 算法”提供了一个客户机和远程文件服务器的文件同步的快速方法,而且可以通过 ssh 方式来传输文件,这样其保密性也非常好。
rsync 包括如下的一些特性:
- 能更新整个目录和树和文件系统;
- 有选择性的保持符号链链、硬链接、文件属于、权限、设备以及时间等;
- 对于安装来说,无任何特殊权限要求;
- 对于多个文件来说,内部流水线减少文件等待的延时;
- 能用 rsh、ssh 或直接端口做为传输入端口;
- 支持匿名 rsync 同步文件,是理想的镜像工具;
rsync 安装与配置
首先可以先看看你的系统中是否已经安装了 rsync:
$ rsync
如果没有安装的话,可通过包管理器或者源码安装。
安装完毕之后,就是软件的配置了。
下面我们假设:
- 主服务器端(master),向从服务器端(slave)同步数据;
- master 端 IP 地址:192.168.1.39(模块名为 node1);
- slave 端 IP 地址:192.168.1.40 (模块名为 node2)。
master 配置
由于是单向同步,所以 master 不需要做特殊的配置,只要安装 rsync 就可以了。
slave 配置
在 /etc 目录下创建 rsyncd.conf,配置如下:
uid = root
gid = root
pid file = /var/run/rsyncd.pid #pid 文件的存放位置
lock file = /var/run/rsync.lock # 锁文件的存放位置
log file = /var/log/rsyncd.log # 日志记录文件的存放
[node2] # 模块名字,自己命名
path = /data/node2 # 指定文件目录所在位置,这是必须指定
read only = no
list = no # 是否把 rsync 服务器上提供同步数据的目录显示
hosts allow = 192.168.1.39 # 允许访问的主机
hosts deny = * # 拒绝访问的主机
这是比较简单的配置,如果需要认证,则需要指定 rsync.passwd 文件。
测试
启动 rsync:
$ mkdir -p /data/node2
$ rsync --daemon
$ ps -ef | grep rsync| grep -v "grep"
root 1723 1 0 22:17 ? 00:00:00 rsync --daemon
$ netstat -anpt | grep rsync
tcp 0 0 0.0.0.0:873 0.0.0.0:* LISTEN 1723/rsync
tcp 0 0 :::873 :::* LISTEN 1723/rsync
在 slave 上创建同步目录:
$ cd /data/node2/
$ echo "123456">a.txt
$ echo "abcd">b.txt
$ cat a.txt b.txt
123456
abcd
在 master 上创建同步目录,并将 slave 上的 node2 模块同步到 /data/node1/ 目录下:
$ mkdir -p /data/node1
$ rsync -avzP 192.168.1.40::node2 /data/node1/
receiving incremental file list
./
a.txt
7 100% 6.84kB/s 0:00:00 (xfer#1, to-check=1/3)
b.txt
5 100% 0.12kB/s 0:00:00 (xfer#2, to-check=0/3)
sent 68 bytes received 180 bytes 23.62 bytes/sec
total size is 12 speedup is 0.05
$ cd /data/node1/
$ ls
a.txt b.txt
$ cat a.txt b.txt
123456
abcd
以上是将 slave 的 node2 模块对应的目录同步到 master 的目录下,如果要将 master 的目录同步到 slave 的 node2 模块对应的目录下,则使用以下命令:
$ rsync -avzP /data/node1/ 192.168.1.40::node2
以上完成后,我们就可以进行同步了,为了方便,我们可以把同步命令写成一个脚本。rsync 有一些配置参数,可以直接输入命令 rsync 来查看。比如–delete 选项表示,会同步删除的文件,比如源主机没有文件 a,而目标主机有,则文件 a 将会从目标主机上删除。
如果你不需要实时性,则可以在每次需要同步的时候,手动运行一下该脚本。
如果你需要实时性,但不需要特别强,则可以使用 crontab 设置一个定时任务来自动同步。
如果你需要很强的实时性,则需要 inotify 的支持。
inotify
使用 inotify 之后,只要文件有任何变动,就会触发 inotify,因此 inotify 基本可以达到实时的效果。
inotify 是一个 Linux 内核特性,它监控文件系统,并且及时向专门的应用程序发出相关的事件警告,比如删除、读、写和卸载操作等。
inotify 安装完成之后会有两个命令,inotifywait 和 inotifywatch。inotifywait 用于等待文件或者文件集上的一个特定事件,可以监控任何文件或者目录位置,并且可以递归地监控整个目录树;inotifywatch 用于收集被监控的文件系统统计数据,包括每个 inotify 事件发生多少次等信息。
安装
$ cd /tmp
$ wget http://github.com/downloads/rvoicilas/inotify-tools/inotify-tools-3.14.tar.gz --no-check-certificate
$ tar zxvf inotify-tools-3.14.tar.gz
$ cd inotify-tools-3.14
$ ./configure&&make&&make install
$ ln -sv /usr/local/lib/libinotify* /usr/lib/
$ ln -s /usr/local/lib/libinotifytools.so.0 /usr/lib64/libinotifytools.so.0
以上安装的是 linux 版本的,如果你是 windows 系统,可以安装 inotify-win(https://github.com/thekid/inotify-win)。
编写测试脚本
#!/bin/bash
src=/tmp/test/ # directory to monitor
/usr/local/bin/inotifywait -rmq -e modify $src | while read event
do
echo "hello" >> 1.txt
done
做成开机启动
$ chmod u+x /tmp/mon.sh
$ echo "nohup /bin/bash /tmp/mon.sh &" >> /etc/rc.d/rc.local
$ nohup /bin/bash /tmp/mon.sh &
这时候只要 /tmp/test/ 一有改动,就会触发 inotifywait,运行 echo 命令。
同步脚本
#!/bin/bash
host=192.168.1.40
data_dir=/data/node1/
dst=node2
/usr/local/bin/inotifywait -mrq --timefmt '%d/%m/%y %H:%M' --format '%T %w%f%e' -e modify,delete,create,attrib $data_dir | while read files
do
#rsync -avzP $host::$dst $data_dir
rsync -avzP --delete --progress $data_dir $host::$dst
echo "${files} was rsynced" >> /tmp/rsync.log 2>&1
done
以上让 inotifywait 监听 /data/node1/ 目录,当监听到有发生 modify,create,delete,attrib 等事件发生时,按 %T %w%f%e 的格式输出。
inotifywait 的输出结果,作为 while read files 的输入。这里的脚本比较粗糙,因为每次有文件改动,inotifywait 就会输出一行,改行表示有改动的文件。之后执行 do 和 done 之间的操作,调用 rsync 进行同步(全目录扫描,而不是只同步单个文件)。因此如果有 10 个文件改动,rsync 将会被调用 10 次,从而造成性能上的损耗。因此对于有兴趣的同学,可以想想如何优化这个脚本,以获得更高的同步性能。
$ chmod u+x inotify_rsync.sh
$ bash inotify_rsync.sh &
[1] 4533
$ ps -ef | grep inoti | grep -v "grep"
root 4533 1880 0 18:02 pts/1 00:00:00 bash inotify_rsync.sh
root 4534 4533 0 18:02 pts/1 00:00:00 /usr/local/bin/inotifywait -mrq --timefmt %d/%m/%y %H:%M --format %T %w%f%e -e modify,delete,create,attrib /data/node1/
root 4535 4533 0 18:02 pts/1 00:00:00 bash inotify_rsync.sh
inotifywait 的一些参数可能根据系统有所不同,请通过 inotifywait 命令查阅下相关参数及其意义。
总结
rsync 为我们提供了一个很好的文件同步方案,在不同的应用场景下,我们对实时性的要求不一,因此可以根据自己的需要选择对应的同步方式。在大多数情况下 rsync+inotify 是足够了的,当然,当同步的文件比较大的时候,可以选择 lsyncd 等更合适的方案。
RSync 实现文件备份同步详解 http://www.linuxidc.com/Linux/2014-09/106967.htm
利用 inotifywait 监控主机文件和目录 http://www.linuxidc.com/Linux/2013-03/81075.htm
利用 inotify+rsync 实现 Linux 文件批量更新 http://www.linuxidc.com/Linux/2012-01/52132.htm
inotify-tools+rsync 实时同步文件安装和配置 http://www.linuxidc.com/Linux/2012-06/63624.htm
rsync 同步完整配置 http://www.linuxidc.com/Linux/2013-06/85781.htm
CentOS 6.5 下 Rsync 远程同步 http://www.linuxidc.com/Linux/2014-05/101084.htm
Linux 文件夹对比并提取的差分文件技巧 -rsync 的妙用 http://www.linuxidc.com/Linux/2016-02/128307.htm
Rsync 的详细介绍 :请点这里
Rsync 的下载地址 :请点这里
本文永久更新链接地址 :http://www.linuxidc.com/Linux/2016-11/136819.htm