排序算法总结之快速排序

hiKirin 2016-05-27

一,快速排序介绍

快速排序与归并排序一样,也是基于分治的递归算法,体现在:在每一趟快速排序中,需要选出枢轴元素,然后将比枢轴元素大的数组元素放在枢轴元素的右边,比枢轴元素小的数组元素都放在枢轴元素的左边。然后,再对分别对 枢轴元素左边 和 枢轴元素右边的元素进行快速排序。

二,快速排序算法分析

 ①相比于直接插入排序,快排合适于数据量大(上百万)的情形,而插入排序适合于小数据量的情形。因为,在数据量小的情形下,快排的递归是需要一定的开销的。

②相比于归并排序,归并排序的比较次数要比快速排序少,但是它需要一个额外的临时数组,而且移动的元素多。而快速排序不需要显示地声明一个临时数组,它用的是递归栈。在C++四使用它来作为标准的排序程序,而JAVA中则是用归并排序来作为标准的排序。

③快速排序主要有两个基本操作:一是选取枢轴元素,另一个则是递归分割数组。枢轴元素的选取对快速排序的效率至关重要,因为它决定了递归的深度。如果枢轴元素刚好处于数组的中间值,那么,数组在分割时就分成了平均的两部分。这样的递归的效率就好。如果每次选取的枢轴元素都是最大/最小 的那个元素,则快排复杂度达到了O(N^2),而且还用了递归栈空间。

④枢轴元素的选取可以采用三数取中法。所谓三数取中法,即给定一个数组,选取数组中的第一个元素,最后一个元素,和中间那个元素。哪个元素的值位于中间,则它作为枢轴元素。比如,a[0]=5 , a[4]=1, a[9]=10,  那么  a[4]<a[0]<a[9]  ,故a[0]是枢轴元素。

采用三数取中法时,会有一个问题,就是当数组不断的递归划分变小之后,枢轴左边的元素个数不足3,这样三数取中法就失去了应有的意义。此外,正如前面提到,对于小数组而言,插入排序反而比快速排序的效率更高。

正是基于以上两个原因,我们可以将快速排序与插入排序结合。当递归划分的数组变小之后,达到某个值(CUTOFF)时,采用插入排序。(代码83行)

三,快速排序算法实现

public class QuickSort {

    private static final int CUTOFF = 10;
   
   
    /**
    *
    * @param arr
    *            待排序的数组
    */
    public static <T extends Comparable<? super T>> void quickSort(T[] arr) {
        quickSort(arr, 0, arr.length - 1);
    }

    /**
    * 快排的基本操作:通过三数取中法来选取枢轴元素
    *
    * @param arr
    *            在[left, right]之间选择pivot element
    * @param left
    *            index of arr to chose pivot element
    * @param right
    *            index of arr to chose pivot element
    * @return pivot element
    */
    private static <T extends Comparable<? super T>> T media3(T[] arr,
            int left, int right) {

        int center = (left + right) / 2;
        if (arr[center].compareTo(arr[left]) < 0)
            swapReference(arr, center, left);
        if (arr[right].compareTo(arr[left]) < 0)
            swapReference(arr, right, left);

        // 参考前面两个if比较之后,最小的元素被放置在
        // arr[left],然后下面再比较中间与最右的元素,将最大的元素放在arr[right],而arr[center]存放中间元素(pivot)
        if (arr[right].compareTo(arr[center]) < 0)
            swapReference(arr, right, center);
       
        swapReference(arr, center, right - 1);//将枢轴元素放在 arr[right-1]上.便于快排交换元素
        return arr[right - 1];
    }

    private static <T extends Comparable<? super T>> void swapReference(
            T[] arr, int from, int to) {
        T tmp = arr[from];
        arr[from] = arr[to];
        arr[to] = tmp;
    }

    /**
    * 实现了递归的快排主例程, internal quicksort method that makes recrusive calls
    *
    * @param arr
    *            an array of comparable items
    * @param left
    *            the left-most index of subarray
    * @param right
    *            the right-most index of subarray
    */
    private static <T extends Comparable<? super T>> void quickSort(T[] arr,
            int left, int right) {
        if(left + CUTOFF <= right)
        {
            T pivot = media3(arr, left, right);
           
            //begin partitoning
            int i = left, j = right - 1;//在media3中已经将比pivot小的元素放到了a[left]上,把pivot放到了arr[right-1]上,故下面的while中是 ++i 和 --j
            for(;;)
            {
                while(arr[++i].compareTo(pivot) < 0){}
                while(arr[--j].compareTo(pivot) > 0){}
                if(i < j)
                    swapReference(arr, i, j);
                else
                    break;
            }
            swapReference(arr, i, right - 1);//restore pivot
            quickSort(arr, left, i - 1);
            quickSort(arr, i + 1, right);
        }else
            //Do an insertion sort on the subarray
            insertSort(arr, left, right);
    }
}

①第3行CUTOFF定义当数组中元素个数为10以下时,采用插入排序。

②第11行的quickSort方法是快排对外提供的接口

③第26行的media3方法实现了三数取中选取枢轴元素。其实,它不仅仅返回了枢轴元素,它还改变了原数组:

1) 它将三个数中最大的那个数放在了数组末尾arr[right]---(比枢轴小的放在枢轴元素左边)

2) 它将三个数中最小的那个数放在了数组的开头arr[left]---(比枢轴大的放在枢轴元素右边)

3) 它将三个数中的中间那个数(枢轴元素)放在了 arr[right-1]位置处!!!---(在第71-72行选取是否交换元素时可以不受枢轴影响)

这是快排算法实现的技巧。

④第61行的quickSort方法则是实现快速递归分割的主例程。首先在第65行选取枢轴元素,第71行,在数组左边寻找比枢轴元素大的元素;第72行,在数组右边寻找比枢轴元素小的元素,第73-74行将之进行交换。可以看出,这些语句实现得非常精巧:在循环中只有自增和自减操作,以及判断语句,因此执行速度是很快的。

在media3中已经将比pivot小的元素放到了a[left]上,把pivot放到了arr[right-1]上,故下面的while中是 ++i 和 --j
⑤第73行if语句 当 i > j 时 表示一趟快排已经结束,第78行将枢轴元素放到它的最终位置。对于快排而言,每进行一趟,枢轴元素的位置就被唯一确定下来,以后都不再变。

⑥第79 和 80行,对枢轴元素左右两个的子数组递归调用。这样,将原问题,划分成了两个子问题。

可以写出它们的递归表达式:T(N)=T(i)+T(N-i-1)+O(N)

⑦当 快速排序划分的子数组足够小时(CUTOFF),不再采用快速排序,而是用插入排序。这样,进一步优化了快速排序的速度。

用到的插入排序实现如下:

private static <T extends Comparable<? super T>> void insertSort(T[] a, int left ,int right){
        for(int p = left + 1; p <= right; p++)
        {
            T tmp = a[p];//保存当前位置p的元素,其中[0,p-1]已经有序
            int j;
            for(j = p; j > 0 && tmp.compareTo(a[j-1]) < 0; j--)
            {
                    a[j] = a[j-1];//后移一位
            }
            a[j] = tmp;//插入到合适的位置
        }

四,快速排序算法复杂度分析

①快速排序的时间复杂度与枢轴元素的选取息息相关。平均情况下,时间复杂度为O(NlogN),最坏情况下为O(N^2)

②枢轴元素的选取有多种方式:比如上面提到的三数取中,也可以采用随机化算法来选取。采用三数取中时,几乎不会出现最坏的情况。相对基于内存排序的其他算法,快速的效率是很高的,它的时间复杂度的常数因子很小。大约是1.3,而归并大约是1.4 ----不太确定。  1.3NlogN 

③快排用到了递归,当数组元素个数很少时,递归的开销就有点大了,故在程序中可将快排与插入排序结合起来。

相关推荐