[算法与数据结构] 《算法导论》堆排序笔记

2017 年 9 月 19 日 机器学习和数学 Alvin_2580


[点击蓝字,一键关注~]



堆排序的实现是靠叫做“堆”的数据结构来实现的。所以学习堆排序,首先要了解什么是堆


堆是一个数组,每个结点表示数组中的一个元素,堆可以看做是一个近似的完全二叉树。完全二叉树是所有叶结点深度相同,且所有内部结点度为2的2叉树。

树的高度:从结点x向下到某个叶结点最长简单路径中边的条数

表示堆的数组A包括两个属性:A.length给出数组元素的个数,A.heap-size表示有多少个堆元素存储在该数组中。


最大堆和最小堆


最大堆:除了根以外的所有结点i都要满足

A[PARENT(i)] >= A[i]

意思是,某个结点的值至多与其父结点一样大。因此,堆中的最大元素存放在根结点中;并且在任一字树中,该字树所包含的所有结点的值都不大于该字树根结点的值。


最小堆: 除了根以外的所有结点i都有

A[PARENT(i)] <=A[i] 

最小堆中的最小元素存放在根结点中。

在堆排序中,一般使用最大堆,最小堆用于构造优先队列。


高度:堆中结点的高度为该结点到叶结点最长简单路径上边的数目。


MAX-HEAPIFY过程:


这个过程的意思其实很简单,就是如果所建的堆不满足堆的性质的时候,如何来调整的过程。下图是书中的栗子,当i=2的时候,就是第二个元素,4小于其叶子结点14,应该调整为他右边的样子,交换4和14的位置,然后交换以后发现4和8又不满足堆的性质了,所以递归上面这个过程,这时候i=4。得到下面那个图,此时不再有数据交换发生。时间负责度为O(h),h为树的高度。


建堆

建堆的意思怎么把一个数组转换为一个最大堆。算法伪代码如下:

BUILD-MAX-HEAP(A)

A.heap-size = A.length

for i =[A.length/2] downto 1

        MAX-HEAPIFY(A,i)


算法的时间复杂度是O(n)。



堆排序

初始时候,堆排序算法利用建最大堆的过程BUILD-MAX-HEAP将输入数组A[1..n]建成最大堆,n=A.length。因为数组中最大元素总在根结点A[1]中,如果不在根结点,则通过把它与A[n]进行交换,将最大元素放到根结点,然后去掉根结点,这时候原来根结点的孩子结点仍然是最大堆,而新的根结点可能会违背最大堆的性质,如果不满足,则继续调用MAX-HEAPIFY(A,i),从而在A[1..n-1]上构造新的最大堆,堆排序就是一直重复这个过程,直到堆的大小从n-1降到2.

算法伪代码如下:
HEAPSORT(A)

BUILD-MAX-HEAP(A)

for i = A.length downto 2

        exchange A[1] with A[i]

        A.heap-size = A.heap-size -1

        MAX-HEAPIFY(A,1)



最后写一个堆排序的Python实现



# 最大堆建立过程
def sink(Ary, k, end_num):
while 2 * k < end_num:
j = 2 * k
if Ary[j] < Ary[j + 1]:
j += 1
       
if Ary[k] > Ary[j]:
break
       
Ary[k], Ary[j] = Ary[j], Ary[k]
k = j

# 堆排序
def heap_sort(Ary):
end_num = len(arr) - 1
   
for k in range(end_num // 2, 0, -1):
sink(Ary, k, end_num)

while end_num > 1:
Ary[1], Ary[end_num] = Ary[end_num], Ary[1]
end_num -= 1
       
sink(Ary, 1, end_num)


## test
arr = [0,  1, 5, 0, 5, 7, 7]
heap_sort(arr)
print(arr)



登录查看更多
1

相关内容

【2020新书】实战R语言4,323页pdf
专知会员服务
100+阅读 · 2020年7月1日
一份简明有趣的Python学习教程,42页pdf
专知会员服务
76+阅读 · 2020年6月22日
算法与数据结构Python,369页pdf
专知会员服务
161+阅读 · 2020年3月4日
【新书】Python中的经典计算机科学问题,224页PDF
专知会员服务
52+阅读 · 2019年12月31日
【电子书】C++ Primer Plus 第6版,附PDF
专知会员服务
87+阅读 · 2019年11月25日
已删除
生物探索
3+阅读 · 2018年2月10日
动手写机器学习算法:K-Means聚类算法
七月在线实验室
5+阅读 · 2017年12月6日
机器学习(29)之奇异值分解SVD原理与应用详解
机器学习算法与Python学习
5+阅读 · 2017年11月30日
利用 TensorFlow 实现排序和搜索算法
机器学习研究会
5+阅读 · 2017年11月23日
机器学习(26)之K-Means实战与调优详解
机器学习算法与Python学习
4+阅读 · 2017年11月19日
机器学习算法实践:Platt SMO 和遗传算法优化 SVM
Python开发者
7+阅读 · 2017年10月21日
算法|学习人工智能算法,你必须掌握的32个算法!
全球人工智能
24+阅读 · 2017年9月17日
机器学习(13)之最大熵模型详解
机器学习算法与Python学习
7+阅读 · 2017年8月24日
Arxiv
4+阅读 · 2018年7月4日
Relational recurrent neural networks
Arxiv
8+阅读 · 2018年6月28日
Arxiv
4+阅读 · 2016年12月29日
VIP会员
相关VIP内容
【2020新书】实战R语言4,323页pdf
专知会员服务
100+阅读 · 2020年7月1日
一份简明有趣的Python学习教程,42页pdf
专知会员服务
76+阅读 · 2020年6月22日
算法与数据结构Python,369页pdf
专知会员服务
161+阅读 · 2020年3月4日
【新书】Python中的经典计算机科学问题,224页PDF
专知会员服务
52+阅读 · 2019年12月31日
【电子书】C++ Primer Plus 第6版,附PDF
专知会员服务
87+阅读 · 2019年11月25日
相关资讯
已删除
生物探索
3+阅读 · 2018年2月10日
动手写机器学习算法:K-Means聚类算法
七月在线实验室
5+阅读 · 2017年12月6日
机器学习(29)之奇异值分解SVD原理与应用详解
机器学习算法与Python学习
5+阅读 · 2017年11月30日
利用 TensorFlow 实现排序和搜索算法
机器学习研究会
5+阅读 · 2017年11月23日
机器学习(26)之K-Means实战与调优详解
机器学习算法与Python学习
4+阅读 · 2017年11月19日
机器学习算法实践:Platt SMO 和遗传算法优化 SVM
Python开发者
7+阅读 · 2017年10月21日
算法|学习人工智能算法,你必须掌握的32个算法!
全球人工智能
24+阅读 · 2017年9月17日
机器学习(13)之最大熵模型详解
机器学习算法与Python学习
7+阅读 · 2017年8月24日
Top
微信扫码咨询专知VIP会员