slave_rows_search_algorithms参数hash_scan的实现方法

247次阅读

没有评论

共计 1880 个字符，预计需要花费 5 分钟才能阅读完成。

slave_rows_search_algorithms 由三个值的组合组成：TABLE_SCAN，INDEX_SCAN，HASH_SCAN。

TABLE_SCAN,INDEX_SCAN (默认配置，表示如果有索引就用索引，否则使用全表扫描)

HASH_SCAN 可以部分解决无主键表导致的复制延迟问题。

当表上无主键或唯一键时，那么对于在该表上做的 DML，如果是以 ROW 模式复制，则每一个行记录前镜像在备库都可能

产生一次全表扫描（或者二级索引扫描），大多数情况下，这种开销都是非常不可接受的，并且会产生大量的延迟。

hash_scan 的实现方法

简单的讲，在 apply rows_log_event 时，会将 log_event 中对行的更新缓存在两个结构中，分别

是：m_hash, m_distinct_key_list。m_hash：主要用来缓存更新的行记录的起始位置，

是一个 hash 表；m_distinct_key_list：如果有索引，则将索引的值 push 到 m_distinct_key_list，如果表没有索引，

则不使用这个 List 结构；其中预扫描整个调用过程如下：Log_event::apply_event

Rows_log_event::do_apply_event

Rows_log_event::do_hash_scan_and_update

Rows_log_event::do_hash_row (add entry info of changed records)

if (m_key_index < MAX_KEY) (index used instead of table scan)

Rows_log_event::add_key_to_distinct_keyset ()

当一个 event 中包含多个行的更改时，会首先扫描所有的更改，将结果缓存到 m_hash 中，如果该表有索引，则将索引的值

缓存至 m_distinct_key_list List 中，如果没有，则不使用这个缓存结构，

而直接进行全表扫描。

执行 stack 如下：

#0 handler::ha_delete_row

#1 0x0000000000a4192b in Delete_rows_log_event::do_exec_row

#2 0x0000000000a3a9c8 in Rows_log_event::do_apply_row

#3 0x0000000000a3c1f4 in Rows_log_event::do_scan_and_update

#4 0x0000000000a3c5ef in Rows_log_event::do_hash_scan_and_update

#5 0x0000000000a3d7f7 in Rows_log_event::do_apply_event

#6 0x0000000000a28e3a in Log_event::apply_event

#7 0x0000000000a8365f in apply_event_and_update_pos

#8 0x0000000000a84764 in exec_relay_log_event

#9 0x0000000000a89e97 in handle_slave_sql

#10 0x0000000000e341c3 in pfs_spawn_thread

#11 0x0000003a00a07851 in start_thread ()

#12 0x0000003a006e767d in clone ()

执行过程说明：

Rows_log_event::do_scan_and_update

open_record_scan()

do

next_record_scan()

if (m_key_index > MAX_KEY)

ha_rnd_next();

else

ha_index_read_map(m_key from m_distinct_key_list)

entry= m_hash->get()

m_hash->del(entry);

do_apply_row()

while (m_hash->size > 0);

从执行过程上可以看出，当使用 hash_scan 时，只会全表扫描一次，虽然会多次遍历 m_hash 这个 hash 表，但是这个扫描

是 O(1), 所以，代价很小，因此可以降低扫描次数，提高执行效率。

正文完

星哥玩云-微信公众号

发表至：数据库技术

2022-01-22

0

转载说明：除特殊说明外本站文章皆由CC-4.0协议发布，转载请注明出处。

MySQL高可用之DRBD + Heartbeat + MySQL

使用phpMyAdmin浏览库结构很卡的问题的解决方案

PXC（Percona XtraDB Cluster）集群的安装与配置详解

如何快速对比MySQL两个不同实例上的数据并找出差异

MySQL优化 – 开启MySQL慢查询日志及分析工具mysqldumpslow

ORA-01017错误解决实例

MySQL执行update操作后引起的问题及解决

MySQL数据库自动生成并修改随机root密码的脚本

MySQL Batched Key Access (BKA)原理和设置使用方法举例

slave_rows_search_algorithms参数hash_scan的实现方法

选择PHP与Python，可以考虑这三个问题

Centos 7平滑无缝升级PHP7.1.0到PHP 7.1.5

介绍ansible的Ad-hoc与commands模块

Linux安装使用pidstat命令以对进程数据进行监控

linux下使用tree命令以树形结构显示文件目录结构

案例：php利用淘宝IP库获取用户ip地理位置

Linux 中 IP工具使用技巧

运维监控工具zabbix概述

详解：Zabbix 3.4 监控 MariaDB 数据库性能

网站受到攻击了？别担心！如何使用EdgeOne来保护我们的网站