Mysql索引

1.概述

索引是存储引擎用于快速找到记录的一种数据结构。在数据量大的时候，索引对性能的影响是巨大的，索引优化是对查询性能优化的最有效的手段，能轻易的将查询性能提高几个数量级。

索引是存储引擎层面关心的事，不同的存储引擎可以使用不同的数据结构实现索引，总结起来主要有一下几种常见的数据结构：

以下三个优点《高性能Mysql》提到的，很多资料都有提到，关于这三点的个人理解如下：

这一点很好理解，使用索引能根据sql中索引的列上的条件缩小符合条件的结果集，避免了全表扫描。

索引中的数据是排序存储的（B+树索引），能对排序有一定的帮助作用，避免在server层有额外的排序工作（explain中Extra列的Using filesort，Using temporary）

这里感觉没有很好的理解，当前能想到的点是如果使用索引覆盖的话，是会把回表的随机io变为顺序io。

聚族索引描述的是对数据的一种组织方式，如果数据在磁盘上的排列方式和索引的顺序一致，那么这个索引就是聚族索引。相反，如果数据的排列顺序与索引的顺序不一致，那么这个索引就是非聚族索引。

根据聚族索引的定义，一张表最多只能有一个聚族索引。

聚族索引的优点：

聚族索引的缺点：

InnoDB的二级索引和MyIsam的索引都是非聚族索引。

借用《高性能 MySql》书中的图，可以看出区别：

那么InnoDB通过非聚族索引查找数据，还需要回到主键索引再查找一次（这个过程称为回表），MyIsam通过非聚族索引查找数据，最后拿到的是数据的地址，可以直接获取数据。

那么InnoDB的非聚族索引为什么要存储PrimaryKey而不是数据的指针呢？好处是：减少了当出现行移动或者数据页分裂时辅助索引的维护工作。

5小节中提到，Mysql二级索引的查询都有回表环节，都依赖主键聚族索引。

如果表没有索引会怎么样呢？InnoDB存储引擎会按如下方式选择或创建主键: