排序相关 STL
本页面将简要介绍 C 和 C++ 标准库中实现的排序算法。
除已说明的函数外,本页所列函数默认定义于头文件 <algorithm>
中。
qsort
参见:qsort
,std::qsort
该函数为 C 标准库实现的 快速排序,定义在 <stdlib.h>
中。在 C++ 标准库里,该函数定义在 <cstdlib>
中。
qsort 与 bsearch 的比较函数
qsort 函数有四个参数:数组名、元素个数、元素大小、比较规则。其中,比较规则通过指定比较函数来实现,指定不同的比较函数可以实现不同的排序规则。
比较函数的参数限定为两个 const void 类型的指针。返回值规定为正数、负数和 0。
比较函数的一种示例写法为:
C | |
---|---|
1 2 3 4 5 6 7 8 9 10 11 |
|
注意:返回值用两个元素相减代替正负数是一种典型的错误写法,因为这样可能会导致溢出错误。
以下是排序结构体的一个示例:
C | |
---|---|
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 |
|
这里也可以看出,等价不代表相等,只代表在此比较规则下两元素等价。
std::sort
参见:std::sort
用法:
C++ | |
---|---|
1 2 3 4 5 6 |
|
注意:sort 的比较函数的返回值是 true 和 false,用 true 和 false 表示两个元素的大小(先后)关系,这与 qsort 的三值比较函数的语义完全不同。具体内容详见上方给出的 sort 的文档。
如果要将 sort 简单改写为 qsort,维持排序顺序整体上不变(不考虑等价的元素),需要将返回 true 改为 - 1,返回 false 改为 1。
std::sort
函数是更常用的 C++ 库比较函数。该函数的最后一个参数为二元比较函数,未指定 cmp
函数时,默认按从小到大的顺序排序。
旧版 C++ 标准中仅要求它的 平均 时间复杂度达到 \(O(n\log n)\)。C++11 标准以及后续标准要求它的 最坏 时间复杂度达到 \(O(n\log n)\)。
C++ 标准并未严格要求此函数的实现算法,具体实现取决于编译器。libstdc++ 和 libc++ 中的实现都使用了 内省排序。
std::nth_element
用法:
C++ | |
---|---|
1 2 |
|
它重排 [first, last)
中的元素,使得 nth
所指向的元素被更改为 [first, last)
排好序后该位置会出现的元素。这个新的 nth
元素前的所有元素小于或等于新的 nth
元素后的所有元素。
实现算法是未完成的内省排序。
对于以上两种用法,C++ 标准要求它的平均时间复杂度为 \(O(n)\),其中 n 为 std::distance(first, last)
。
它常用于构建 K-D Tree。
std::stable_sort
用法:
C++ | |
---|---|
1 2 |
|
稳定排序,保证相等元素排序后的相对位置与原序列相同。
时间复杂度为 \(O(n\log (n)^2)\),当额外内存可用时,复杂度为 \(O(n\log n)\)。
std::partial_sort
用法:
C++ | |
---|---|
1 2 3 |
|
将序列中前 k
元素按 cmp
给定的顺序进行原地排序,后面的元素不保证顺序。未指定 cmp
函数时,默认按从小到大的顺序排序。
复杂度:约 \((\mathit{last}-\mathit{first})\log(\mathit{mid}-\mathit{first})\) 次应用 cmp
。
原理:
std::partial_sort
的思想是:对原始容器内区间为 [first, mid)
的元素执行 make_heap()
操作,构造一个大根堆,然后将 [mid, last)
中的每个元素和 first
进行比较,保证 first
内的元素为堆内的最大值。如果小于该最大值,则互换元素位置,并对 [first, mid)
内的元素进行调整,使其保持最大堆序。比较完之后,再对 [first, mid)
内的元素做一次堆排序 sort_heap()
操作,使其按增序排列。注意,堆序和增序是不同的。
自定义比较
参见:运算符重载
内置类型(如 int
)和用户定义的结构体允许定制调用 STL 排序函数时使用的比较函数。可以在调用该函数时,在最后一个参数中传入一个实现二元比较的函数。
对于用户定义的结构体,对其使用 STL 排序函数前必须定义至少一种关系运算符,或是在使用函数时提供二元比较函数。通常推荐定义 operator<
。1
示例:
C++ | |
---|---|
1 2 3 4 |
|
C++ | |
---|---|
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 |
|
严格弱序
进行排序的运算符必须满足严格弱序,否则会出现不可预料的情况(如运行时错误、无法正确排序)。
严格弱序的要求:
- \(x \not< x\)(非自反性)
- 若 \(x < y\),则 \(y \not< x\)(非对称性)
- 若 \(x < y, y < z\),则 \(x < z\)(传递性)
- 若 \(x \not< y, y \not< x, y \not< z, z \not< y\),则 \(x \not< z, z \not< x\)(不可比性的传递性)
常见的错误做法:
- 使用
<=
来定义排序中的小于运算符。 - 在调用排序运算符时,读取外部数值可能会改变的数组(常见于最短路算法)。
- 将多个数的最大最小值进行比较的结果作为排序运算符(如皇后游戏/加工生产调度 中的经典错误)。
外部链接
参考资料与注释
-
因为大部分标准算法默认使用
operator<
进行比较。 ↩
本页面的全部内容在 小熊老师 - 莆田青少年编程俱乐部 0594codes.cn 协议之条款下提供,附加条款亦可能应用