Shell Sort
- 希尔排序是一种分组插入排序
- 首先取一个整数d1=n/2,n为列表长度,将元素分为d1个组,每组相邻量的元素之间距离为d1,在各组内进行直接插入排序
- 去第二个整数d2=d1/2,重复上述分组排序过程,直到di=1,即所有元素在同一组内进行直接插入排序
- 希尔排序每趟并不使某些元素有序,而是使整体数据越来越接近有序,最后一趟排序使得所有数据有序
两个两个为一组,每组中的两个数的间隔是d1 = n//2,分好后从头开始看每一组两个数的大小关系,前小后大就不用交换,否则需要交换两个数的位置。这算第一趟排序。后续排序的间隔都为前一次的间隔整除二,直到间隔为1时,即为最后一次排序。
演示:
[6, 5, 9, 4, 7, 0, 1, 2, 3, 8] # 原列表,初始gap为10//2==5
# 从左开始遍历,(6,0),(5,1),(9,2),(4,3),(7,8),一个gap组,比较每组中两个数大小
# (6,0),(5,1),(9,2),(4,3),第一位都比第二位大,所以交换位置,(7,8)不用
[0, 1, 2, 3, 7, 6, 5, 9, 4, 8]
# 第二趟排序,gap=5//2=2,则比较的组有(0,2),(1,3),(2,7),(3,6),(7,5),(6,9),(5,4),(9,8)
# 可以看出,当gap变小时会出现两个组共同拥有同一个元素,如果前一个组合发生交换,那么后一个组合进行判断时,元素是要跟着前一个进行改变的
# 比如这里的(7,5)(5,4),第一个发生交换(5,7),后一个如果要比较就是比较(7,4),交换为(4,7)
# 因为交换后前面的组合就是(5,4),也需要交换,于是交换为(4,5)
# 又影响后面的组合(4,7)变为(5,7)
[0, 1, 2, 3, 4, 6, 5, 8, 7, 9]
# 第三趟排序,gap=2//2=1,两两比较交换,(6,5)(8,7),交换为(5,6)(7,8)
[0, 1, 2, 3, 4, 5, 6, 8, 7, 9]
因为希尔排序是一种分组的插入排序,所以我们可以由插入排序的代码,引入一个gap(间隔)参数来改编:
def Insert_sort_gap(list,gap):for i in range(gap,len(list)): temp = list[i] # 存储摸到的牌,防止后续被覆盖j = i-gap # 隔gap张牌while j >= 0 and list[j] > temp:list[j+gap] = list[j] j -= gaplist[j+gap] = temp return list
- 假设手上有gap张牌(每一组的左边的牌在我们手上,有gap组),我们从第gap张牌开始摸。所以 i 从gap开始直到最后
- 插入排序是逐个比较,这个排序是与相隔gap个元素比较,所以 j = i-gap
- while循环,首先要保证指针要在列表内,所以是 j >= 0,逐个与temp值比较,直到把temp值放在一个适当的位置,比temp大的就往右移动,比temp小的就停在这个数的右边(隔gap个)。由上面的过程演示图可以知道,从左向右遍历,判断是否交换位置,在完成相邻gap的元素交换后,也要保持所有与该数有关的组合是有序的状态,否则需要继续调整。
- 主体代码:
def shell_sort(li):d = len(li) // 2 # 定义间距,也就是gapwhile d >= 1: # 间距不小于1时Insert_sort_gap(li,d) # 调用分组插入函数d //= 2 # 每次循环后,d整除2return li
以上就是一种希尔排序的完整代码,实际上希尔排序还有很多很多种实现方式
以下是我通过理解写的代码,感觉比较符合变化的步骤(有需要可以看看)
def shell_sort(li):gap = len(li)//2 # 确定gap的初始长度while gap >= 1: # 保证gap要不小于1,gap=1表示两元素相邻for i in range(gap, len(li)): # i指针j = i - gap # j指针while j >= 0: # 保证j在列表内if li[j] > li[i]: # 如果前大后小li[j], li[i] = li[i], li[j] # 交换两数i = j # 此时i指向此时的j位置j -= gap # j指向j-gap的位置# 此while循环,保证每次交换后,与前面的数都保持有序# 因为i是在for内的局部变量,在内层的while中修改,当跳出循环时,仍然可以正常执行gap //= 2 # 每次循环gap整除2return li
讨论
- 希尔排序的时间复杂度讨论比较复杂,并且和选取的gap序列有关,我们上面所演示的两种都是用n除2的k次方的形式实现,这种gap序列,在最坏情况下的时间复杂度是O(n的平方)
- 维基百科上搜gap序列,会有从诞生开始直到近代的所有gap序列以及对应的最坏时间复杂度的信息,有兴趣可以去看看