MySQL聚簇索引&聚集索引&索引组织表myisam

admin

January 19, 2016 - One minute read - 36 words

MySQL聚簇索引&聚集索引&索引组织表

http://www.cnblogs.com/hustcat/archive/2009/10/28/1591648.html

聚簇索引和聚集索引(Clustered Index)

说起索引，不能不说B+树。

引用： http://blog.codinglabs.org/articles/theory-of-mysql-index.html
MySQL官方对索引的定义为：索引（Index）是帮助MySQL高效获取数据的数据结构。提取句子主干，就可以得到索引的本质：索引是数据结构。
我们知道，数据库查询是数据库的最主要功能之一。我们都希望查询数据的速度能尽可能的快，因此数据库系统的设计者会从查询算法的角度进行优化。最基本的查询算法当然是顺序查找（linear search），这种复杂度为O(n)的算法在数据量很大时显然是糟糕的，好在计算机科学的发展提供了很多更优秀的查找算法，例如二分查找（binary search），二叉树查找（binary tree search）等。如果稍微分析一下会发现，每种查找算法都只能应用于特定的数据结构之上，例如二分查找要求被检索数据有序，而二叉树查找只能应用于二叉查找树上，但是数据本身的组织结构不可能完全满足各种数据结构（例如，理论上不可能同时将两列都按顺序进行组织），所以，在数据之外，数据库系统还维护着满足特定查找算法的数据结构，这些数据结构以某种方式引用（指向）数据，这样就可以在这些数据结构上实现高级查找算法。这种数据结构，就是索引。

MySQL就普遍使用B+Tree实现其索引结构。

聚簇索引并不是一种单独的索引类型，而是一种数据存储方式。具体的细节依赖于其实现方式，但InnoDB的聚簇索引实际上在同一个结构中保存了B-Tree索引和数据行。

当表有聚簇索引时，他的数据行实际上存放在索引的叶子页（leaf page）中。术语 “聚簇”表示数据行和相邻的键值紧凑地存储在一起（这并非总成立）。

因为无法同时把数据行存放在两个不同的地方，索引一个表只能有一个聚簇索引。

注：叶子页面包含完整的元组，而内节点页面仅包含索引的列(索引的列为整型)。一些DBMS允许用户指定聚簇索引，但是MySQL的存储引擎到目前为止都不支持。InnoDB对主键建立聚簇索引。如果你不指定主键，InnoDB会用一个具有唯一且非空值的索引来代替。如果不存在这样的索引，InnoDB会定义一个隐藏的主键，然后对其建立聚簇索引。一般来说，DBMS都会以聚簇索引的形式来存储实际的数据，它是其它二级索引的基础。

索引组织表(Index Organized Table, IOT)

其实和聚簇索引说的是一个意思。

索引组织表（Index organized table, IOT）就是存储在一个索引结构中的表。与堆组织表无序存储不同的是，IOT中的数据按主键存储和排序。

相比堆组织表，索引组织表能够节省一部分空间，因为使用堆组织表时，我们必须为表和表的主键上的索引分别留出空间。而IOT则可以省去主键索引的开销，因为数据就是按顺序存储的，可以当做索引使。换句话说，如果你只会通过一个表的主键来访问这个表，这个表就适合创建成索引组织表。

举例：
1.一个客户有很多地址信息，客户是一个表，客户地址信息是另外一个表。读取一个客户地址信息的时候，如果这个客户的所有地址信息都存放在相邻的地方，读取速度就会快一些。这个时候，客户地址信息表适合创建成IOT。
经常查看一支股票的最近几天的信息，股票信息一般是千万级别的数据，如果能够把最近几天的信息存放在一起就会快很多。

=======================END=======================

转： http://my.oschina.net/xinxingegeya/blog/474895

Mysql