共计 3047 个字符,预计需要花费 8 分钟才能阅读完成。
一. Oracle DataGuard 简介
Oracle DataGuard;简称 DG。是由一个 Primary Database(主库)和一个或者多个 Standby Database(备库)组成。对 Oracle 来说;本身不能提高性能。通过数据冗余来保护数据。由 Primary Database 对外提供服务;用户操作在 Primary Database 上操作;其操作的数据库 Redo Log 或者 Archive log 通过网络传输到 Standby Database。Standby Database 在重做这些日志。从而实现 Primary Database 和 Standby Database 数据同步。
架构图如下:
Oracle DataGuard 中的 Standby 库有两种:物理 Standby 和逻辑 Standby。
- 逻辑 Standby 接收后将其转换成 SQL 语句,在 Standby 数据库上执行 SQL 语句实现同步,这种方式叫 SQL Apply。
- 物理 Standby 接收完 Primary 数据库生成的 REDO 数据后,以介质恢复的方式实现同步,这种方式也叫 Redo Apply。
本例采用物理 Standby 架构;在 Oracle DataGuard 有两种角色:Primary 和 Standby
二、Oracle DataGuard 角色以及角色转换
2.1、Oracle DataGuard 两种角色
- Primary 角色:对应的数据库为主库。对外可提供读写操作;以及一些维护数据库操作也是在主库上。
- Standby 角色:对应的数据库为备库。对外只提供读操作。用于数据库的展示以及数据库备份。
2.2、角色转换
数据库对外提供高可用性;主库发生故障;备库可以提升为主库对外提供服务;不影响业务正常运行。这是需要做一个操作就是角色转换。
角色转换也有两种不同的操作类型:switchover 和 failover。前者是无损切换,不会丢失数据。后者有可能丢失数据。并且切换后原 Primary 数据库不再是该 DataGuard 一部分。其也有可能对外提供服务;在其他数据库称为“脑裂”。
2.2.1、switchover
是主数据库与其中一个 standby 数据库的转换,switchover 能确保没有数据丢失,这是在有计划的系统维护时的典型做法。
使用场景
- 有计划的灾备切换演练,如测试灾备站点的可用性,客户端连接等,确保主库发生重大意外时,可以切换至备库正常运转。
- 主库长时间的维护升级, 如 OS 升级,DB 滚动升级,更换存储,更换 OS 硬件设备等。
- 切换有风险,一般不做切换。
2.2.2、failover
在主数据库不活动的时候,Failover 可将 Standby 数据库转换为主数据库角色,Failover 可能会导致数据出现丢失的情况。Failover 只在主数据发生失败的情况下才使用。
三、准备工作
- 检查个数据库的初始化参数文件,主要确认各待转换角色的数据库,对不同角色的相关的初始化参数都进行正确的配置。
- 检查即将成为 Primary 数据库的物理 Standby 服务器是否为归档模式
- 检查物理 Standby 数据库的临时文件是否存在,并匹配 Primary 数据库的临时文件
- 选择一个最合适的物理 Standby 转换为 Primary。如考察数据库的 IO/CPU/ 内存。确保转换后能提供服务。
四、操作步骤
3.1、执行 switchover
从原 Primary 数据库端开始操作;到新 Primary 数据库端的操作结束
3.1.1、primary 节点
查询 V$DATABASE 视图的 SWITCHOVER_STATUS 列。
- 检查是否支持 switchover 操作
SQL> select switchover_status from v$database;
SWITCHOVER_STATUS
------------------------------------------------------------
TO STANDBY
- 结果为 TO STANDBY;则表示 Primary 数据库支持转换为 Standby 角色。
- 结果为 SESSIONS ACTIVE;说明当前有会话在连接 Primary 数据库。这种情况代表不能进行转换;需要关闭 oracle 所有的客户端连接。即需要提前通知开发人员终止客户端连接。也可以使用命令强制终止
ps -ef | grep oracleorcl | awk '{system("kill -9 "$2)}'
- 启动 switchover
将 primary 数据库转换为 standby 角色
alter database commit to switchover to physical standby;
-- 可用来处理前一步有用户在连接的情况
alter database commit to switchover to physical standby with session shutdown;
执行了该命令。原 primary 数据库将会转为 standby 数据库。
重启原 primary 数据库到 mount 状态
shutdown immediate;
startup mount;
3.1.2、standby 节点
查询 V$DATABASE 视图的 SWITCHOVER_STATUS 列。
- 检查是否支持 switchover 操作
SQL> select switchover_status from v$database;
SWITCHOVER_STATUS
------------------------------------------------------------
TO PRIMARY
- 结果为 TO PRIMARY;则表示 standby 数据库支持转换为 primary 角色。
- 结果为 SESSIONS ACTIVE;说明当前有会话在连接原 standby 数据库
- 结果为 SWITCHOVER PENDING;说明当前 standby 数据库没有启动 redo 应用。执行
alter database recover managed standby database using current logfile disconnect from session;
- switchover
alter database commit to switchover to primary
;
重启数据库
新备库在启动 redo 应用即可
alter database recover managed standby database using current logfile disconnect from session;
3.2、执行 failover
failover 操作;一般表示 primary 数据库瘫痪,最起码就是失败。相当于 primary 数据库服务器挂了。现在需要提升 standby 数据库来接管服务。在这个过程可能会存在丢失数据。所有建议 Primary 数据库还能使用。不要执行 failover。
3.2.1、检查归档日志是否连续
查询待转换 standby 数据库的 v$archive_gap 视图;确认归档文件是否连续
select thread#, low_sequence#, high_sequence# from v$archive_gap;
若有返回记录;通过命令加入数据字典
alter database register physical logfile 'filesepec1'
3.2.2、启动 failover
alter database recover managed standbyf database finish force;
3.2.3、转为 primary 节点
alter database commit to switchover to primary
3.2.4、重启数据库