阿里云-云小站(无限量代金券发放中)
【腾讯云】云服务器、云数据库、COS、CDN、短信等热卖云产品特惠抢购

让你脑洞大开的MySQL优化技巧

47次阅读
没有评论

共计 2828 个字符,预计需要花费 8 分钟才能阅读完成。

由于分库分表的原因,和开发规定了不能使用 表表 JOIN 语句。因此,我们要将 JOIN 语句的转化成使用 IN 来做。如现在有 表 A(a_id, c_a)c_a 有普通索引, 表 B(b_id, c_a) 这两个表要关联, 应该转化为以下步骤处理:

  • 先查询 B 中的 a_id
SELECT c_a FROM B WHERE xxx;
  • 使用 IN 查询 A 表
SELECT a_id, ... FROM A WHERE c_a IN(在 1 中查出来的 c_a)
场景

现在表的数据量有 800 万。

一般的使用语句是:

SELECT * FROM A WHERE c_a IN(955555, 955556, 955557, 955558, 955559);

上面语句会执行的很快,知道使用 explain 的都明白这样一般都是会使用索引的,并且是所有范围扫描。

MySQL 不会从 1 开始 扫描 800 万,而是从 555555 扫描到 555559(只要扫描 5 行数据)。

在一般情况下是没有什么问题的。但是如果 IN 里面的数据是不连续的就有很大问题了。

创建表结构语句
CREATE TABLE t(
    id INT unsigned NOT NULL AUTO_INCREMENT,
    cid INT unsigned NOT NULL DEFAULT 0,
    c1 VARCHAR(50) NOT NULL DEFAULT '',
    c2 VARCHAR(50) NOT NULL DEFAULT '',
    c3 VARCHAR(50) NOT NULL DEFAULT '',
    c4 VARCHAR(50) NOT NULL DEFAULT '',
    c5 VARCHAR(50) NOT NULL DEFAULT '',
    c6 VARCHAR(50) NOT NULL DEFAULT '',
    PRIMARY KEY(id),
    INDEX idx$cid(cid)
);
 
INSERT INTO t VALUES(
    NULL,
    FLOOR(RAND() * 1000000),
    REPEAT('a', 50),
    REPEAT('a', 50),
    REPEAT('a', 50),
    REPEAT('a', 50),
    REPEAT('a', 50),
    REPEAT('a', 50)
);
 
-- 重复执行
INSERT INTO t
SELECT NULL,
    FLOOR(RAND() * 1000000),
    c1,
    c2,
    c3,
    c4,
    c5,
    c6
FROM t;
下面是具体的实验过程
  • 使用 IN 查询连续的数
SELECT *
FROM t
WHERE cid IN(955555, 955556, 955557, 955558, 955559);
+---------+--------+-----------------------------------
| id      | cid    | c1                               
+---------+--------+-----------------------------------
|  319330 | 955555 | aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa
| 1885293 | 955555 | aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa
| ......
| 8733757 | 955559 | aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa
| 8796305 | 955559 | aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa
+---------+--------+-----------------------------------
41 rows in set (0.15 sec)
  • 使用 IN 查询不连续的数
SELECT *
FROM t
WHERE cid IN(1, 5000, 50000, 500000, 955559);
+---------+--------+-----------------------------------
| id      | cid    | c1                               
+---------+--------+-----------------------------------
|      1 |  341702 |      1 | aaaaaaaaaaaaaaaaaaaaaaaaa
|      1 | 1045176 |      1 | aaaaaaaaaaaaaaaaaaaaaaaaa
......
| 955559 | 8733757 | 955559 | aaaaaaaaaaaaaaaaaaaaaaaaa
| 955559 | 8796305 | 955559 | aaaaaaaaaaaaaaaaaaaaaaaaa
+--------+---------+--------+--------------------------
41 rows in set (4.34 sec)
  • 使用 UNION 优化
SELECT *
FROM (
    SELECT 1 AS cid UNION ALL
    SELECT 5000 UNION ALL
    SELECT 50000 UNION ALL
    SELECT 500000 UNION ALL
    SELECT 955559
) AS tmp, t
WHERE tmp.cid = t.cid;
+---------+--------+-----------------------------------
| id      | cid    | c1                               
+---------+--------+-----------------------------------
|      1 |  341702 |      1 | aaaaaaaaaaaaaaaaaaaaaaaaa
|      1 | 1045176 |      1 | aaaaaaaaaaaaaaaaaaaaaaaaa
......
| 955559 | 8733757 | 955559 | aaaaaaaaaaaaaaaaaaaaaaaaa
| 955559 | 8796305 | 955559 | aaaaaaaaaaaaaaaaaaaaaaaaa
+--------+---------+--------+--------------------------
41 rows in set (0.01 sec)

从上面可以看出上面使用 UNION 的方法生成一个临时表作为关联的主表。

拓展

要是 MySQL 有只带的一个行转列的函数那就完美了。这样我们就可以不用使用 UNION 了。

SELECT 1, 5000, 50000, 500000, 955559;
+---+------+-------+--------+--------+
| 1 | 5000 | 50000 | 500000 | 955559 |
+---+------+-------+--------+--------+
| 1 | 5000 | 50000 | 500000 | 955559 |
+---+------+-------+--------+--------+
1 row in set (0.00 sec)
     
变成以下
SELECT row_to_col(1, 5000, 50000, 500000, 955559);
+--------+
|     id |
+--------+
|      1 |
|   5000 |
|  50000 |
| 500000 |
| 955559 |
+--------+

要是能像上面就太棒了简直。

阿里云 2 核 2G 服务器 3M 带宽 61 元 1 年,有高配

腾讯云新客低至 82 元 / 年,老客户 99 元 / 年

代金券:在阿里云专用满减优惠券

正文完
星哥说事-微信公众号
post-qrcode
 0
星锅
版权声明:本站原创文章,由 星锅 于2024-07-24发表,共计2828字。
转载说明:除特殊说明外本站文章皆由CC-4.0协议发布,转载请注明出处。
【腾讯云】推广者专属福利,新客户无门槛领取总价值高达2860元代金券,每种代金券限量500张,先到先得。
阿里云-最新活动爆款每日限量供应
评论(没有评论)
验证码
【腾讯云】云服务器、云数据库、COS、CDN、短信等云产品特惠热卖中