分享一个MySQL 多列索引优化实例代码

由于爬虫抓取的数据不断增多，这两天在不断对数据库以及查询语句进行优化，其中一个表结构如下：
create table `newspaper_article` ( `id` varchar(50) not null comment '编号', `title` varchar(190) not null comment '标题', `author` varchar(255) default null comment '作者', `date` date null default null comment '发表时间', `content` longtext comment '正文', `status` tinyint(4) default '0', primary key (`id`), key `idx_status_date` (`status`,`date`) ) engine=innodb default charset=utf8mb4 comment='文章表';
根据业务需要，添加了 idx_status_date 索引，在执行下面这个 sql 时特别耗时：
select id, title, status, date from article where status > -2 and date = '2016-01-07';
根据观察，每天新增的数据大概在2500条以内，本以为这里指定了具体某天的日期 '2016-01-07' ，实际需要扫描的数据量应该在2500条以内才对，但实际并非如此：
实际共扫描了185589条数据，远远高于预估的2500条，且实际执行时间都将近3秒钟：
这是为什么呢？
解决方案将 idx_status_date (status, date) 改为 idx_status (status) 后，查看 mysql 执行计划：
可以看到将多列索引改为单列索引后，执行计划要扫描的数据总量没有任何变化。结合多列索引遵循最左前缀原则，推测上面的查询语句只使用了 idx_status_date 最左边的 status 的索引。
翻了下《高性能mysql》找到了下面这段话，证实了我的想法：
如果查询中有某个列的范围查询，则其右边所有列都无法使用索引优化查找。例如有查询 where last_name = 'smith' and first_name like 'j%' and dob = '1976-12-23' ，这个查询只能使用索引的前两列，因为这里 like 是一个范围条件（但是服务器可以把其余列用于其他目的）。如果范围查询列值的数量有限，那么可以通过使用多个等于条件来代替范围条件。
因此，这里解决思路有两种：
可以通过使用多个等于条件来代替范围条件
修改 idx_status_date (status, date) 为索引 idx_date_status (date, status) ，并新建一个 idx_status 索引，即可达到同样的效果。
优化后的执行计划：
实际执行结果：
总结当人们谈论索引的时候，如果没有特别指明类型，那么多半说的是 b-tree 索引，它使用 b-tree 数据结构来存储数据。我们使用术语“b-tree”，是因为 mysql 在 create table 和其他语句中也使用该关键字。不过，底层的存储引擎也可能使用不同的存储结构。innodb使用的是b+tree。
假如有如下数据表：
create table people ( last_name varchar(50) not null, first_name varchar(50) not null, dob date not null, gender enum('m', 'f') not null, key(last_name, first_name, dob) );
b-tree 索引对如下类型的查询有效全值匹配
全值匹配指的是和索引中的所有列进行匹配，例如上表的索引可用于查找姓名为 cuba allen 、出生于 1960-01-01 的人。
匹配最左前缀
上表中的索引可用于查找所有姓为 allen 的人，即只使用索引的第一列。
匹配列前缀
只匹配某一列的值的开头部分。例如上表的索引可用于查找所有以 j 开头的姓的人。这里也只使用了索引的第一列。
匹配范围值
例如上表中的索引可用于查找姓在 allen 和 barrymore 之间的人。这里也只使用了索引的第一列。
精确匹配某一列并范围匹配另外一列
上表的索引也可用于查找所有姓为 allen ，并且名字是字母 k 开头（比如 kim 、 karl 等）的人。即第一列 last_name 全匹配，第二列 first_name 范围匹配。
只访问索引的查询
b-tree 通常可以支持“只访问索引的查询”，即查询只需要访问索引，而无须访问数据行。
b-tree 索引的一些限制如果不是按照索引的最左列开始查找，则无法使用索引。例如上表的索引无法用于查找名字为 bill 的人，也无法查找某个特定生日的人，因为这两列都不是最左数据列。类似地，也无法查找姓氏以某个字母结尾的人。
不能跳过索引中列。也就是说，上表的索引无法用于查找姓氏为 smith 并且在某个特定日期出生的人。如果不指定名（first_name），则 mysql 只能使用索引的第一列。
如果查询中有某个列的范围查询，则其右边所有列都无法使用索引优化查找。例如有查询 where last_name = 'smith' and first_name like 'j%' and dob = '1976-12-23' ，这个查询只能使用索引的前两列，因为这里 like 是一个范围条件（但是服务器可以把其余列用于其他目的）。如果范围查询列值的数量有限，那么可以通过使用多个等于条件来代替范围条件。
以上就是分享一个mysql 多列索引优化实例代码的详细内容。

分享一个MySQL 多列索引优化实例代码

VIP推荐