阿里云-云小站(无限量代金券发放中)
【腾讯云】云服务器、云数据库、COS、CDN、短信等热卖云产品特惠抢购

MySQL借助ibd文件恢复数据技巧?

82次阅读
没有评论

共计 4663 个字符,预计需要花费 12 分钟才能阅读完成。

导读 磁盘坏道、断电等意外不是常态,但遇上了就足够你“惊心动魄”!如果是数据库损坏造成的数据丢失,Binlog 也不可用了,怎么办?为了在短时间内无损恢复数据以保证业务稳定性,除了利用 binlog,我们还修炼了一招新的恢复技能!

还记得我们之前写过的《只需一招,让失控的研发爱上你》吗?前文提到过我们日常使用的比较多的两种数据库恢复方法是:

MySQL 借助 ibd 文件恢复数据技巧?

以上两种方法都可以实现实时性的回档,但是你会认为有了这两种技能就够了吗?

不….!

在线上这种错综复杂的架构中,其实还有很多未知的原因,我们是没法预知的。例如以下这种情况:

因辛勤劳动而折寿的磁盘产生成长坏道,导致数据库损坏。而又刚好损坏了 ibdata 文件和 binlog 文件。那么如果还想着以定时备份 +binlog 恢复的方案就不可能了,难道只能用定点备份回档吗?深思熟虑后,作为一名运维人员,我们是绝对不会在万不得已的情况下实行有损回档,因为这对业务产生太大的影响了,但是除此之外又能怎么办呢?下面我们将要放一门大招!!!

首先检查数据库环境,是否开启了独立表空间,如果已经开启的话,那恭喜你,有很大的机会可以恢复全部数据。我们可以依赖每个数据库目录下的 frm 和 ibd 文件来实现数据恢复,一般来说如果使用了 InnoDB 但没开启独立表空间的话,所有的数据库表信息和元数据都会写入 ibdata 文件里,这样长久运行的话,ibdata 文件会变得越来越大,数据库性能下降。InnoDB 提供了开启独立表空间参数,可以让数据独立存放起来,这样子 ibdata 文件只用于存放一些引擎相关的索引信息,实际的数据写入到独立的 frm 和 ibd 文件里。

好,有了 frm 和 ibd 文件,我们可以开始尝试数据恢复了,他的过程比 binlog 还原既惊险又有趣!首先我们来看一下关于 ibd 和 frm 的说明:

.frm 文件:保存了每个表的元数据,包括表结构的定义等,该文件与数据库引擎无关。

.ibd 文件:InnoDB 引擎开启了独立表空间 (my.ini 中配置 innodb_file_per_table = 1) 产生的存放该表的数据和索引的文件。

我们都知道,对于 InnoDB 的数据库,如果不把整个数据目录拷贝,只拷贝指定数据库目录到新的实例下,数据库是认不出来的。那么如何根据这两个文件还恢复数据库呢?

恢复思路:

由于 ibdata 文件上存放了一些关于引擎的索引信息,ibdata 文件损坏导致表名索引丢失而无法启动。那么我们可以先把原来旧的整个数据目录改名备份,然后重新初始化数据库生成新的 ibdata 文件,然后重新创建原有的数据库以及对应的表,最后把备份的表空间 id 号改为新建的表空间 id 号(ibdata 文件里有每个表唯一的表空间索引 id,该 id 由创建新表的数量依次递增),这样就可以恢复原来的数据库了。
举个例子:
库名:test_restore
表结构:db_struc.sql
表文件:G_RESTORE.ibd、G_RESTORE.frm

1. 创建新库,导入表结构

阿里云 2 核 2G 服务器 3M 带宽 61 元 1 年,有高配

腾讯云新客低至 82 元 / 年,老客户 99 元 / 年

代金券:在阿里云专用满减优惠券

2. 查看并修改 test_restore 库中表在新实例中的 id
#vim -b /data/database/mysql/test_restore/G_RESTORE.ibd

直接打开为乱码,转成 16 进制查看。Vi 中执行  :%!xxd 转化为 16 进制。结果为 :

MySQL 借助 ibd 文件恢复数据技巧?

如图所示。G_RESTORE 表在 mysql 数据库中的 id 为 00fe。

修改备份的 G_RESTORE.ibd 文件。操作同上,注意需先备份。

#cp G_RESTORE.ibd{,_back}

#vim -v G_RESTORE.ibd

MySQL 借助 ibd 文件恢复数据技巧?

将 011b 修改为 00fe。注意。修改完成后需要在 vim 中先执行 :%!xxd  -r

再 wq 保存退出文件。不然保存到的是 16 进制查看的结果。

保存结果如下:

MySQL 借助 ibd 文件恢复数据技巧?

 

将修改好的 G_RESTORE.ibd 替换掉新数据库中的 G_RESTORE.ibd 文件。

关于 ibdata 表 id 的解释:

MySQL 借助 ibd 文件恢复数据技巧?

参考官方文档解释,每个表空间分配了 4 个字节存储了表空间 id 信息, 最后偏移量地址为 38。还有一组预留的表空间 id,同样是 4 个字节,最后偏移量地址为 42。

3. 验证并还原 mysql 数据

关闭 mysql。修改 my.conf。
innodb_force_recovery=6 innodb_purge_threads=0

启动数据库。如果不修改。数据库会认为 G_RESTORE 已被损坏。

Select 一下,即可查看到还原结果,但此时插入数据会报错,应尽快将数据 dump 出来 , 导回原来的实例中。

导出数据,再导入数据,恢复完毕!

#mysqldump -uroot –p****** test_restore > test_restore.sql

#mysql -uroot –p****** test_restore < test_restore.sql

说明:变更了新的 space id 后的.ibd 表文件,启动数据库后只能认出数据,但不能写入,这是因为原 ibdata 文件不仅保存了 space id 索引,还同时保存了一些其它的元数据。为了使元数据补全,所以采取导出、再导入的操作。

以上举例为单个库表的恢复过程,看到这里大家一定会产生另一个疑问吧?线上的场景不可能是只有一个表的,数据库表很多的情况下,这样一个个表的修改,速度无疑是太慢了。那么存在大量表的情况下如何恢复呢?思路是,取得备份的 ibd 文件的 id 值,按 id 值顺序来建表,中间跨度随便建表语句来凑够数(每个表空间索引 id 由创建新表的数量依次递增)。实现方式如下:

1. 获取备份数据库 ibd 文件的 space id 号,并排序。

for ibd in `find test_restore/ -name“*.ibd”` ; do  echo -e“${ibd/////}   /c”;hexdump -C ${ibd} |head -n 3 |tail -n 1|awk‘{print  strtonum(“0x”$6$7)}’;done | sort -n  -k 3 | column -t > /tmp/

生成的 ibd.txt 文件,格式如下:(库名–表名–SpaceId)

MySQL 借助 ibd 文件恢复数据技巧?
2. 新建表,查看当前表空间 id(假设 space id 为 10)

#mysql -uroot –p****** -e”create table test.tt(a bool)”#hexdump -C mysql/test/tt.ibd |head -n 3 |tail -n 1|awk‘{print  strtonum(“0x”$6$7)}’

3. 先创建所有库,准备所有表结构,写脚本,依据 space id 号自动创建新表

准备好数据库表结构,可以从备份文件里取出来(我们备份方式是把结构和数据分开备份的),或者从其他有相同表结构的服务器上备份再拷贝过来。

参考备份语句:

mysqldump -uroot –p****** -d ${db} –T /data/backup/${db}/

创建原有的数据库:

mysql -uroot –p****** -e“create database ${db}”

恢复表 id 创建表脚本:

#!/bin/bash
#因为前面假设为 10,所以从 11 开始创建
oid=11

#打开前面生成的 ibd.txt 文件,按行读取”库名–表名–SpaceId”cat /tmp/ibd.txt | while read db tb id ;do

#假如我们需要恢复 catetory 表,他的 id 为 415,基于 id 是创表自增的原则,即 415-11=404,#我们还需要循环创建 404 个表后,才真正导入 catetory 表结构。for ((oid;oid<id;oid++)); do
mysql -uroot –p****** -e“create table test.t(a bool);drop table test.t;”&& echo“${oid} ok”done

#循环创建 404 次表后,id 为 415,与原来备份的.ibd 文件编号一致,导入表结构
mysql -uroot –p****** ${db} < /data/backup/${db}/${tb%%.ibd}.sql && echo“${oid} ${db}/${tb%%.ibd}.sql ok”let oid=oid+1
done

4. 检查表空间 id 和备份的是否一致

for ibd in `find test_restore/ -name“*.ibd”` ; do  echo -e“${ibd/////}   /c”;hexdump -C ${ibd} |head -n 3 |tail -n 1|awk‘{print  strtonum(“0x”$6$7)}’;done | sort -n  -k 3 | column -t > /tmp/ibd2.txt

确认一致后,拷贝备份的.ibd 文件到新数据库实例目录下,修改 my.cnf

innodb_force_recovery=6

innodb_purge_threads=0

启动数据库。后续步骤如同单表恢复,直接导出恢复到原来实例中即可。

当然,这种方式是在数据库出现极端情况下,不得不采取的一种方式,线上最重要的还是做好主从同步和定时备份,从而规避此类风险。

关于 InnoDB 引擎独立表空间说明:

使用过 MySQL 的同学,刚开始接触最多的莫过于 MyISAM 表引擎了,这种引擎的数据库会分别创建三个文件:表结构、表索引、表数据空间。我们可以将某个数据库目录直接迁移到其他数据库也可以正常工作。然而当你使用 InnoDB 的时候,一切都变了。

InnoDB 默认会将所有的数据库 InnoDB 引擎的表数据存储在一个共享空间中:ibdata1,这样就感觉不爽,增删数据库的时候,ibdata1 文件不会自动收缩,单个数据库的备份也将成为问题。通常只能将数据使用 mysqldump 导出,然后再导入解决这个问题。

但是可以通过修改 MySQL 配置文件 [mysqld] 部分中 innodb_file_per_table 的参数来开启独立表空间模式,每个数据库的每个表都会生成一个数据空间。

优点:

1.每个表都有自已独立的表空间。

2.每个表的数据和索引都会存在自已的表空间中。

3.可以实现单表在不同的数据库中移动。

4.空间可以回收(除 drop table 操作处,表空不能自已回收)

a) Drop table 操作自动回收表空间,如果对于统计分析或是日值表,删除大量数据后可以通过:alter table TableName engine=innodb; 回缩不用的空间。

b) 对于使 innodb-plugin 的 Innodb 使用 turncate table 也会使空间收缩。

c) 对于使用独立表空间的表,不管怎么删除,表空间的碎片不会太严重的影响性能,而且还有机会处理。

缺点:

单表增加过大,如超过 100 个 G。

结论:

共享表空间在 Insert 操作上少有优势。其它都没独立表空间表现好。当启用独立表空间时,请合理调整一下:innodb_open_files。

配置方式:
1.innodb_file_per_table 设置. 开启方法:

在 my.cnf 中 [mysqld] 下设置

innodb_file_per_table=1
2. 查看是否开启:
mysql> show variables like‘%per_table%’;

3. 关闭独享表空间
innodb_file_per_table= 0 关闭独立的表空间

mysql> show variables like‘%per_table%’;

阿里云 2 核 2G 服务器 3M 带宽 61 元 1 年,有高配

腾讯云新客低至 82 元 / 年,老客户 99 元 / 年

代金券:在阿里云专用满减优惠券

正文完
星哥玩云-微信公众号
post-qrcode
 0
星锅
版权声明:本站原创文章,由 星锅 于2024-07-24发表,共计4663字。
转载说明:除特殊说明外本站文章皆由CC-4.0协议发布,转载请注明出处。
【腾讯云】推广者专属福利,新客户无门槛领取总价值高达2860元代金券,每种代金券限量500张,先到先得。
阿里云-最新活动爆款每日限量供应
评论(没有评论)
验证码
【腾讯云】云服务器、云数据库、COS、CDN、短信等云产品特惠热卖中