MySQL 浅析order by 如何执行

MySQL排序算法：全字段与RowId排序对比

最新推荐文章于 2024-07-27 17:31:21 发布

原创最新推荐文章于 2024-07-27 17:31:21 发布 · 844 阅读

CC 4.0 BY-SA版权

文章标签：

26 篇文章

订阅专栏

本文主要介绍了MySQL的排序算法，包括全字段排序和RowId排序。全字段排序将所需字段存入sort_buffer排序，数据量大时性能差；RowId排序先排部分字段，再回原表取数据。还指出并非所有order by都需排序，使用覆盖索引可避免。

Mysql会给每个线程分配一块内存用于排序，称为sort_buffer

select city,name,age from t where city='杭州' order by name limit 1000  ;

在这里插入图片描述

对于这样的一条语句，有索引city，MySQL的order by默认是这样执行的：

这种方法我们暂且称之为全字段排序。

值得注意的是，sort_buffer_size参数是MySQL为排序开辟的内存大小，如果需要排序的数据量小于sort_buffer_size，就直接内存排序，否则借助磁盘临时文件进行外部排序，外部排序一般使用归并排序算法。

高枕无忧了？并不，可以看出来全字段排序是把需要查询的数据都干进sort_buffer，如果想要的字段过多，那么就会利用磁盘临时文件，并且会有很多个临时文件，排序的性能会很差。

max_length_for_sort_data 是MySQL用来控制单行长度的一个参数，如果单行数据大于这个参数，那么MySQL就会采用另外一个算法：

如果 MySQL 实在是担心排序内存太小，会影响排序效率，才会采用 rowid 排序算法，这样排序过程中一次可以排序更多行，但是需要再回到原表去取数据。
如果 MySQL 认为内存足够大，会优先选择全字段排序，把需要的字段都放到 sort_buffer 中，这样排序后就会直接从内存里面返回查询结果了，不用再回到原表去取数据。