阿里云-云小站(无限量代金券发放中)
【腾讯云】云服务器、云数据库、COS、CDN、短信等热卖云产品特惠抢购

ORA-00600 kcratr_nab_less_than_odr 解决方案

227次阅读
没有评论

共计 4716 个字符,预计需要花费 12 分钟才能阅读完成。

今天由于客户现场异常断电,Oracle 数据库又无法启动了,远程上去看看吧。

1. 数据库只能 mount,已经无法启动

SQL> select status from v$instance;
STATUS
————
MOUNTED
SQL> ALTER DATABASE OPEN;
ALTER DATABASE OPEN
*
ERROR at line 1:
ORA-01589: must use RESETLOGS or NORESETLOGS option for database open

2. 尝试 recover 和 resetlogs open 都不行

SQL> recover database;
ORA-00283: recovery session canceled due to errors
ORA-01610: recovery using the BACKUP CONTROLFILE option must be done
SQL> ALTER DATABASE OPEN resetlogs;
ALTER DATABASE OPEN resetlogs
*
ERROR at line 1:
ORA-01113: file 1 needs media recovery
ORA-01110: data file 1: ‘D:\APP\ORACLE\ORADATA\PRJDB\SYSTEM01.DBF’

3.Alert log 显示错误

~~~~~~~~~~~~~~~~
Sun Jan 14 19:52:29 2018
ALTER DATABASE OPEN
Beginning crash recovery of 1 threads
parallel recovery started with 3 processes
……
Started redo scan
Completed redo scan
read 2300 KB redo, 0 data blocks need recovery
Errors in file d:\app\oracle\diag\rdbms\prjdb\prjdb\trace\prjdb_ora_1644.trc  (incident=315209):
ORA-00600: internal error code, arguments: [kcratr_nab_less_than_odr], [1], [29904], [4864], [4870], [], [], [], [], [], [], []
Incident details in: d:\app\oracle\diag\rdbms\prjdb\prjdb\incident\incdir_315209\prjdb_ora_1644_i315209.trc
Aborting crash recovery due to error 600
Errors in file d:\app\oracle\diag\rdbms\prjdb\prjdb\trace\prjdb_ora_1644.trc:
ORA-00600: internal error code, arguments: [kcratr_nab_less_than_odr], [1], [29904], [4864], [4870], [], [], [], [], [], [], []
Errors in file d:\app\oracle\diag\rdbms\prjdb\prjdb\trace\prjdb_ora_1644.trc:
ORA-00600: internal error code, arguments: [kcratr_nab_less_than_odr], [1], [29904], [4864], [4870], [], [], [], [], [], [], []
ORA-600 signalled during: ALTER DATABASE OPEN…
~~~~~~~~~~~~~~~~~~~

4. 结合 ALERT 里的错误 ORA-00600: internal error code, arguments: [kcratr_nab_less_than_odr], [1], [29904], [4864], [4870], 是由于服务器异常断电,导致 LGWR 写 redo log 时失败,
下次重新启动数据库时,需要做实例级恢复,而又无法从联机日志文件里获取到这些 redo 信息,因为上次断电时,写日志失败了。

5. 那么 ORA-00600 的错误里,那几个参数 [1], [29904], [4864], [4870] 的含义是,实例需要恢复 sequence 为 29904 的 redo 文件,需要恢复到编号为 4870 的日志块,而实际上只能恢复到第 4864 个日志块儿,所以数据库就不能正常启动。

6. 那我们怎么办呢?先检查一下控制文件和 datafile 记录的 checkpoint_change# 信息吧。

数据文件检查点(记录在控制文件中)

SQL> select file#,checkpoint_change#,last_change# from v$datafile where rownum<5;
    FILE# CHECKPOINT_CHANGE# LAST_CHANGE#
———- —————— ————
        1          664629049
        2          664629049
        3          664629049
        4          664629049

系统检查点(记录在控制文件中)

SQL>  select checkpoint_change# from v$database;
CHECKPOINT_CHANGE#
———- —————— ————
        664607310

数据文件头检查点(记录在数据文件中)

SQL> select file#,checkpoint_change# from v$datafile_header where rownum<5;
    FILE# CHECKPOINT_CHANGE#
———- ——————
        1          664629049
        2          664629049
        3          664629049
        4          664629049

-7. 以上三个 checkpoint_change#要一致 (只读、脱机表空间除外),数据库才能正常打开。否则会需要进行一步的处理。正常关库时,会生成新的检查点,写入上述三个 checkpoint_change#,同时数据文件中的 last_change#也会记录下该检查点,也就是说三个 checkpoint_change#与 last_change# 记录着同一个值。

-8. 通过上面的错误,以及 checkpoint_change#的不一致,已经可以确认,就是控制文件,由于断电。导致的 controlfile 损坏(checkpoint_change# 不一致)。

-9. 由于没有备份,我们只能通过重建 controlfile 的方式,来解决这个问题。

指定 trace 文件的生成路径
SQL&gt; alter database backup controlfile to trace as ‘/tmp/controlfile.trc’;

生成文件提取建库脚本如下,启动数据库到 nomount 状态,执行下面脚本。
注意:类似的恢复操作,先将现有的数据库进行备份。即使这个数据库已经无法启动。我们也要防止恢复操作导致的更严重的问题。

CREATE CONTROLFILE REUSE DATABASE “PRJDB” NORESETLOGS FORCE LOGGING ARCHIVELOG
    MAXLOGFILES 16
    MAXLOGMEMBERS 3
    MAXDATAFILES 200
    MAXINSTANCES 8
    MAXLOGHISTORY 584
LOGFILE
  GROUP 1 ‘D:\APP\ORACLE\ORADATA\PRJDB\REDO01.LOG’  SIZE 50M BLOCKSIZE 512,
  GROUP 2 ‘D:\APP\ORACLE\ORADATA\PRJDB\REDO02.LOG’  SIZE 50M BLOCKSIZE 512,
  GROUP 3 ‘D:\APP\ORACLE\ORADATA\PRJDB\REDO03.LOG’  SIZE 50M BLOCKSIZE 512
DATAFILE
  ‘D:\APP\ORACLE\ORADATA\PRJDB\SYSTEM01.DBF’,
  ‘D:\APP\ORACLE\ORADATA\PRJDB\SYSAUX01.DBF’,
  ‘D:\APP\ORACLE\ORADATA\PRJDB\UNDOTBS01.DBF’,
  ‘D:\APP\ORACLE\ORADATA\PRJDB\USERS01.DBF’
CHARACTER SET US7ASCII;

-10. 检查数据库状态

SQL> select status from v$instance;
STATUS
 —— —– –
MOUNTED

-11. 尝试重启一下,看到是需要恢复的(其实我是知道这样起不来的,但是就像任性的看看报错)。

SQL> alter database open;
alter database open
*
ERROR at line 1:
ORA-01113: file 1 needs media recovery
ORA-01110: data file 1: ‘D:\APP\ORACLE\ORADATA\PRJDB\SYSTEM01.DBF’

-12. 恢复数据库,其实啥也没做,recover 就是走个过场,但是必须得走这个流程。

SQL> recover database;
Media recovery complete.

11. 启动数据库,成功

SQL> alter database open;
Database altered.
SQL> select status from v$instance;
STATUS
— ——–
OPEN

12. 再看看 checkpoint_change# 值,统一了吧。
SQL> select file#,checkpoint_change#,last_change# from v$datafile where rownum<5;
 FILE# CHECKPOINT_CHANGE# LAST_CHANGE#
———- —————— ————
    1          664649053
    2          664649053
    3          664649053
    4          664649053

SQL> select checkpoint_change# from v$database;
CHECKPOINT_CHANGE#
——————
    664649053

SQL> select file#,checkpoint_change# from v$datafile_header where rownum<5;
 FILE# CHECKPOINT_CHANGE#
———- ——————
    1          664649053
    2          664649053
    3          664649053
    4          664649053

最后,再唠叨一下,备份真的很重要!很简单!没有备份的数据库,不单单是裸奔那么简单!不出问题,丢人!出问题,伤身啊!!

如何重建控制文件,请参考:https://www.linuxidc.com/Linux/2018-03/151561.htm

更多 Oracle 相关信息见 Oracle 专题页面 https://www.linuxidc.com/topicnews.aspx?tid=12

正文完
星哥玩云-微信公众号
post-qrcode
 0
星锅
版权声明:本站原创文章,由 星锅 于2022-01-22发表,共计4716字。
转载说明:除特殊说明外本站文章皆由CC-4.0协议发布,转载请注明出处。
【腾讯云】推广者专属福利,新客户无门槛领取总价值高达2860元代金券,每种代金券限量500张,先到先得。
阿里云-最新活动爆款每日限量供应
评论(没有评论)
验证码
【腾讯云】云服务器、云数据库、COS、CDN、短信等云产品特惠热卖中