快速排序,简称快排。其实看快速排序的名字就知道它肯定是一个很牛的排序,C语言中的qsort和C++中的sort底层都是快排。
快速排序由于排序效率在同为O(N*logN)的几种排序方法中效率较高,因此经常被采用,再加上快速排序思想----分治法也确实实用,因此很多软件公司的笔试面试,包括像腾讯,微软等知名IT公司都喜欢考这个,还有大大小的程序方面的考试如软考,考研中也常常出现快速排序的身影。
目录
快排的单趟排序
1. hoare版本
2. 挖坑法
3. 前后指针版本
快排的递归实现
快排的非递归实现
快排的优化
1.随机选数
2.三数取中
3.小区间优化
4.三路并排
快排基本思想:
动图演示:
将区间按照基准值划分为左右两半部分的常见方式有:
1. hoare版本
2. 挖坑法
3. 前后指针版本
单趟排序后的目标:左边的值比key要小,右边的值比key要大。
hoare版本时,如果我们选择最左边的值做key,一定要让右边的指针先走,如果我们选择最右边的值做key,一定要让左边的指针先走,这是为了保证左右指针相遇时指向的值比key小,最后把相遇的值和key值交换,达到单趟排序的目的。
左右指针指向的值和key做比较时要加上等于,如果不加等于,当数组里都是同一个数时,会陷入死循环。
代码:
int Partion(int* a,int left,int right)
{int keyi = left;while (left < right){//右边先走,找小//防止特殊情况,保证left= a[keyi])right--;//左边再走,找大while (left < right && a[left] <= a[keyi])left++;Swap(&a[left], &a[right]);}Swap(&a[left], &a[keyi]);keyi = left;return keyi;
}
1.begin =L; end = R; 将key挖出形成第一个坑a[begin]。
2.end--由后向前找比key小的数,找到后挖出此数填前一个坑a[begin]中,此数的位置变成新的坑位。
3.begin++由前向后找比key大的数,找到后也挖出此数填到前一个坑a[end]中,此数的位置变成新的坑位。
4.再重复执行2,3二步,直到begin ==end ,将基准数填入a[begin]中。
代码:
// 快速排序挖坑法
int PartSort2(int* a, int left, int right)
{int keyi = a[left];int hole = left;int begin = left;int end = right;while (begin < end){while (begin < end && a[end] >= a[keyi])end--;a[hole] = a[end];hole = end;while (begin < end && a[begin] <= keyi)begin++;a[hole] = a[begin];hole = begin;}a[hole] = keyi;return hole;
}
快速排序的前后指针法相比于Hoare版和挖坑版在思路上有点不同,前后指针版的思路是引入两个指针cur和prev(待排序数的下标),在开始的时候先规定一个基准值key(一般为最右边或者最左边的那个数据),然后让两个指针指向key的下一个数(也可以prev指向),开始下面循环: 若cur指向的内容小于key,则prev先向后移动一位,然后交换prev和cur指向的数,然后cur++;如果cur指向的内容大于key,则cur++。
可以选取最左边的值或者最右边的值做key,但是要注意一些细节性的问题,最左边做key,结束的时候直接将key和prev的值交换,最右边做key,结束的时候需要把prev++,再将key和prev的值交换。
最左边的值做key示意图:
代码:
// 快速排序前后指针法
int PartSort3(int* a, int left, int right)
{int keyi = left;int prev = left;int cur = left + 1;while (cur <= right){if (a[cur] < a[keyi] && a[++prev] != a[cur]){Swap(&a[prev], &a[cur]);} cur++;}Swap(&a[prev], &a[keyi]);return prev;
}
快排的递归思想类似于二叉树的前序遍历。
代码:
void QuickSort(int* a, int left, int right)
{//结束条件:当区间只有一个数或者区间不存在if (left >= right)return;int keyi = PartSort1(a, left, right);//int keyi = PartSort2(a, left, right);//int keyi = PartSort3(a, left, right);QuickSort(a, left, keyi - 1);QuickSort(a, keyi + 1, right);
}
计算机在实现递归时会调用系统的堆栈,这很消耗计算机内存资源,所以采用非递归算法的本质就是手动模拟系统的堆栈调用来降低computer资源的消耗。
基本思路:
1.对原数组进行一次划分,分别将最左边的元素下标和最右边的元素下标入栈 stack。
2.判断 stack 是否为空,若是,直接结束;若不是,将栈顶元素下标取出,进行一次划分。
3.判断左边的元素长度(这里指 right - left + 1)大于 1,将左边的元素下标入栈;同理,右边的元素下标。
4.循环步骤 2、3。
用C语言实现非递归的快排需要自己实现栈,用C++可以直接使用自带的栈。
C语言代码(栈需要自己实现):
void QuickSortRon(int* a, int left, int right)
{ST st;StackInit(&st);StackPush(&st,left);StackPush(&st, right);while (!StackEmpty(&st)){int end = StackTop(&st);StackPop(&st);int begin = StackTop(&st);StackPop(&st);int keyi = Partion1(a, begin, end);//int keyi = Partion2(a, begin, end);//int keyi = Partion3(a, begin, end);//[left, keyi - 1] keyi [keyi + 1, right]if (keyi + 1 < end){StackPush(&st, keyi + 1);StackPush(&st, end);}if (begin < keyi - 1){StackPush(&st, begin);StackPush(&st, keyi - 1);}}StackDestroy(&st);}
C++代码:
#include
#include
using namespace std;void QuickSortRon(int* a, int left, int right)
{//手动利用栈来存储每次分块快排的起始点//栈非空时循环获取中轴入栈stack s;if (left < right){int keyi = PartSort1(a, left, right);if (keyi - 1 > left) //确保左分区存在 {//将左分区端点入栈 s.push(left);s.push(keyi - 1);}if (keyi + 1 < right) //确保右分区存在 {s.push(keyi + 1);s.push(right);}while (!s.empty()){//得到某分区的左右边界 int end = s.top();s.pop();int begin = s.top();s.pop();keyi = PartSort1(a, begin, end);if (keyi - 1 > begin) //确保左分区存在 {//将左分区端点入栈 s.push(begin);s.push(keyi - 1);}if (keyi + 1 < end) //确保右分区存在 {s.push(keyi + 1);s.push(end);}}}
}
上述选key值的方法都存在一定的缺陷:
当选到的key值都是中位数,快排效率最好,类似于二分。当选到的key值都是最大或最小值,快排效率会很慢。快排的递归调用会创建函数栈帧,递归层数太多,可能会栈溢出。
int key = left + rand() % (left + right);
选取左边,中间,右边,既不是最大,也不是最小的那个数做key。(面对最坏的情况,选中位数做key,变成最好的情况)
int GetMidIndex(int* a, int left, int right)
{//int mid = (left + right) / 2;int mid = left + ((right - left) >> 1);if (a[left] > a[mid]){if (a[mid] > a[right]){return mid;}else if (a[left] < a[right]){return left;}else{return right;}}else//arr[left] < arr[mid]{if (a[mid] < a[right]){return mid;}else if (a[left] > a[right]){return left;}else{return right;}}
}
对于递归的快排小区间优化,当分割到小区间时,不再用递归分割的思路给这段子区间排序,直接使用插入排序,减少递归次数,因为最后几层的递归几乎占了递归的绝大部分。
//递归实现快速排序O(N*logN)
void QuickSort(int* arr, int left, int right)
{if (left >= right)return;//小区间优化,当分割到小区间时,不再用递归分割的思路让这段子区间有序//对于递归快排,减少递归次数if (right - left + 1 < 10)//区间可以不确定,保证是比较小的区间就可以了{InsertSort(arr + left, right - left + 1);}else{int keyi = Partion3(arr, left, right);//[left,keyi] keyi [keyi+1,right]QuickSort(arr, left, keyi - 1);QuickSort(arr, keyi + 1, right);}}
快排有一个缺陷:当需要排序的数全部相同时,或者大量数据相同时,性能会下降,快排会非常慢,我们可以采用一些方法优化。
在上述的快排中,我们采用的都是两路并排的方法,即选一个key值,把比key小的值甩到一边,比key大的值甩到一边。为了优化排序的数全部相同或者大部分相同这些情况,我们采用三路并排,即将比key小的值甩到左边,比key大的值甩到右边,和key相等的值放到中间。
1.a[cur]
2.a[cur]==key ,cur++ ,保证等于key的值在中间
3.a[cur]>key 交换right和cur
代码:
void QuickSort(int* a, int left, int right)
{if (left >= right)return;if ((right - left + 1) < 15){//小区间使用直接插入,减少递归次数InsertSort(a + left, right - left + 1);}else{//三数取中int mid = GetMidIndex(a, left, right);Swap(&a[left], &a[mid]);int begin = left, end = right;int key = a[begin];int cur = begin + 1;while (cur <= end){if (a[cur] < key){Swap(&a[begin], &a[cur]);cur++;begin++;}else if (a[cur] > key){Swap(&a[end], &a[cur]);end--;}else //a[cur]==key{cur++;}}QuickSort(a, left, end - 1);QuickSort(a, end + 1, right);}}