wuxiaosi0 2019-12-10
目录
所谓排序,就是使一串记录,按照其中的某个或某些关键字的大小,递增或递减的排列起来的操作。排序算法,就是如何使得记录按照要求排列的方法。
经过某种排序后,如果两个记录序号同等,且两者在原无序记录中的先后秩序依然保持不变,则称所使用的排序方法是稳定的,反之是不稳定的。
内排序:排序过程中,待排序的所有记录全部放在内存中
外排序:排序过程中,使用到了外部存储。
通常讨论的都是内排序。
以下的七种排序算法只是所有排序算法中最经典的几种,不代表全部。
介绍:
冒泡排序的原理非常简单,它重复地走访过要排序的数列,一次比较两个元素,如果他们的顺序错误就把他们交换过来。
步骤:
python实现
def bubble_sort(arr): n = len(arr) # 遍历所有数组元素 for i in range(n): for j in range(0, n - i - 1): if arr[j] > arr[j + 1]: #如果前者比后者大 arr[j], arr[j + 1] = arr[j + 1], arr[j] #则交换两者 return print(arr) arr = [64, 34, 25, 12, 22, 11, 90] bubble_sort(arr)
介绍:
选择排序无疑是最简单直观的排序。它的工作原理如下。
步骤:
python实现
def select_sort(arr): n = len(arr) for i in range(n): min = i # 最小元素下标标记 for j in range(i + 1, n): if arr[j] < arr[min]: min = j # 找到最小值的下标 arr[min], arr[i] = arr[i], arr[min] # 交换两者 return print(arr) arr = [64, 34, 25, 12, 22, 11, 90] select_sort(arr)
介绍:
插入排序的工作原理是,对于每个未排序数据,在已排序序列中从后向前扫描,找到相应位置并插入。
步骤:
排序演示:
python实现
def inset_sort(arr): n = len(arr) for i in range(1,n): if arr[i] < arr[i-1]: temp = arr[i] index = i # 待插入的下标 for j in range(i-1,-1,-1): # 从i-1 循环到 0 包括0 if arr[j] > temp: arr[j+1] = arr[j] index = j # 记录待插入的下标 else: break arr[index] = temp return print(arr) arr = [64, 34, 25, 12, 22, 11, 90] inset_sort(arr)
介绍:
希尔排序,也称递减增量排序算法,实质是分组插入排序。由 Donald Shell 于1959年提出。希尔排序是非稳定排序算法。
希尔排序的基本思想是:将数组列在一个表中并对列分别进行插入排序,重复这过程,不过每次用更长的列(步长更长了,列数更少了)来进行。最后整个表就只有一列了。将数组转换至表是为了更好地理解这算法,算法本身还是使用数组进行排序。
例如,假设有这样一组数[ 13 14 94 33 82 25 59 94 65 23 45 27 73 25 39 10 ]
,如果我们以步长为5开始进行排序,我们可以通过将这列表放在有5列的表中来更好地描述算法,这样他们就应该看起来是这样:
13 14 94 33 82 25 59 94 65 23 45 27 73 25 39 10
然后我们对每列进行排序:
10 14 73 25 23 13 27 94 33 39 25 59 94 65 82 45
将上述四行数字,依序接在一起时我们得到:[ 10 14 73 25 23 13 27 94 33 39 25 59 94 65 82 45 ]
。这时10已经移至正确位置了,然后再以3为步长进行排序:
10 14 73 25 23 13 27 94 33 39 25 59 94 65 82 45
排序之后变为:
10 14 13 25 23 33 27 25 59 39 65 73 45 94 82 94
最后以1步长进行排序(此时就是简单的插入排序了)。
python实现
def shell_sort(ary): n = len(ary) gap = round(n/2) #初始步长 , 用round四舍五入取整 while gap > 0 : for i in range(gap,n): #每一列进行插入排序 , 从gap 到 n-1 temp = ary[i] j = i while ( j >= gap and ary[j-gap] > temp ): #插入排序 ary[j] = ary[j-gap] j = j - gap ary[j] = temp gap = round(gap/2) #重新设置步长 return print(ary) ary = [13, 14, 94, 33, 82, 25, 59, 94, 65, 23, 45, 27, 73, 25, 39, 10] shell_sort(ary)
介绍:
归并排序是采用分治法的一个非常典型的应用。归并
排序的思想就是先递归
分解数组,再合
并数组。
先考虑合并两个有序数组,基本思路是比较两个数组的最前面的数,谁小就先取谁,取了后相应的指针就往后移一位。然后再比较,直至一个数组为空,最后把另一个数组的剩余部分复制过来即可。
再考虑递归分解,基本思路是将数组分解成left
和right
,如果这两个数组内部数据是有序的,那么就可以用上面合并数组的方法将这两个数组合并排序。如何让这两个数组内部是有序的?可以再二分,直至分解出的小组只含有一个元素时为止,此时认为该小组内部已有序。然后合并排序相邻二个小组即可。
排序演示:
python实现
def merge_sort(ary): if len(ary) <= 1: return ary num = int(len(ary) / 2) # 二分分解 left = merge_sort(ary[:num]) right = merge_sort(ary[num:]) return merge(left, right) # 合并数组 def merge(left, right): '''合并操作, 将两个有序数组left[]和right[]合并成一个大的有序数组 ''' l, r = 0, 0 # left与right数组的下标指针 result = [] while l < len(left) and r < len(right): if left[l] < right[r]: result.append(left[l]) l += 1 else: result.append(right[r]) r += 1 result += left[l:] result += right[r:] return result ary = [13, 14, 94, 33, 82, 25, 59, 94, 65, 23, 45, 27, 73, 25, 39, 10] merge_sort(ary)
介绍:
快速排序通常明显比同为Ο(n log n)的其他算法更快,因此常被采用,而且快排采用了分治法的思想,所以在很多笔试面试中能经常看到快排的影子。可见掌握快排的重要性。
步骤:
排序演示:
python实现
def quick_sort(ary): return qsort(ary, 0, len(ary) - 1) def qsort(ary, left, right): # 快排函数,ary为待排序数组,left为待排序的左边界,right为右边界 if left >= right: return ary key = ary[left] # 取最左边的为基准数 lp = left # 左指针 rp = right # 右指针 while lp < rp: while ary[rp] >= key and lp < rp: rp -= 1 while ary[lp] <= key and lp < rp: lp += 1 ary[lp], ary[rp] = ary[rp], ary[lp] ary[left], ary[lp] = ary[lp], ary[left] qsort(ary, left, lp - 1) qsort(ary, rp + 1, right) return ary ary = [13, 14, 94, 33, 82, 25, 59, 94, 65, 23, 45, 27, 73, 25, 39, 10] quick_sort(ary)
介绍:
堆排序在 top K 问题中使用比较频繁。堆排序是采用二叉堆的数据结构来实现的,虽然实质上还是一维数组。二叉堆是一个近似完全二叉树 。
二叉堆具有以下性质:
步骤:
n/2
开始的元素均为大根堆。于是只要从n/2-1
开始,向前依次构造大根堆,这样就能保证,构造到某个节点时,它的左右子树都已经是大根堆。heap[0]
与heap[n-1]
交换,再对heap[0...n-2]
做最大堆调整。第二次将heap[0]
与heap[n-2]
交换,再对heap[0...n-3]
做最大堆调整。重复该操作直至heap[0]
和heap[1]
交换。由于每次都是将最大的数并入到后面的有序区间,故操作完后整个数组就是有序的了。排序演示:
python实现
def heap_sort(ary): n = len(ary) first = int(n / 2 - 1) # 最后一个非叶子节点 for start in range(first, -1, -1): # 构造大根堆 max_heapify(ary, start, n - 1) for end in range(n - 1, 0, -1): # 堆排,将大根堆转换成有序数组 ary[end], ary[0] = ary[0], ary[end] max_heapify(ary, 0, end - 1) return print(ary) # 最大堆调整:将堆的末端子节点作调整,使得子节点永远小于父节点 # start为当前需要调整最大堆的位置,end为调整边界 def max_heapify(ary, start, end): root = start while True: child = root * 2 + 1 # 调整节点的子节点 if child > end: break if child + 1 <= end and ary[child] < ary[child + 1]: child = child + 1 # 取较大的子节点 if ary[root] < ary[child]: # 较大的子节点成为父节点 ary[root], ary[child] = ary[child], ary[root] # 交换 root = child else: break ary = [13, 14, 94, 33, 82, 25, 59, 94, 65, 23, 45, 27, 73, 25, 39, 10] heap_sort(ary)
下面为七种经典排序算法指标对比情况:
要知道时间复杂度只是描述一个增长趋势,复杂度为O的排序算法执行时间不一定比复杂度为O长,因为在计算O时省略了系数、常数、低阶。实际上,在对小规模数据进行排序时,n2的值实际比 knlogn+c还要小。