漫画:什么是桶排序?

2018 年 10 月 30 日 算法与数据结构

来自:程序员小灰(微信号:chengxuyuanxiaohui)




—————  第二天  —————














————————————










让我们先来回顾一下计数排序:


计数排序需要根据原始数列的取值范围,创建一个统计数组,用来统计原始数列中每一个可能的整数值所出现的次数。


原始数列中的整数值,和统计数组的下标是一一对应的,以数列的最小值作为偏移量。比如原始数列的最小值是90, 那么整数95对应的统计数组下标就是 95-90 = 5。





那么,桶排序当中所谓的“桶”,又是什么概念呢?


每一个桶(bucket)代表一个区间范围,里面可以承载一个或多个元素。桶排序的第一步,就是创建这些桶,确定每一个桶的区间范围:



具体建立多少个桶,如何确定桶的区间范围,有很多不同的方式。我们这里创建的桶数量等于原始数列的元素数量,除了最后一个桶只包含数列最大值,前面各个桶的区间按照比例确定。


区间跨度 = (最大值-最小值)/ (桶的数量 - 1)



第二步,遍历原始数列,把元素对号入座放入各个桶中:




第三步,每个桶内部的元素分别排序(显然,只有第一个桶需要排序):




第四步,遍历所有的桶,输出所有元素:


0.5,0.84,2.18,3.25,4.5


到此为止,排序结束。




  
  
    
  1. public static double[] bucketSort(double[] array){

  2.    //1.得到数列的最大值和最小值,并算出差值d

  3.    double max = array[0];

  4.    double min = array[0];

  5.    for(int i=1; i<array.length; i++) {

  6.        if(array[i] > max) {

  7.            max = array[i];

  8.        }

  9.        if(array[i] < min) {

  10.            min = array[i];

  11.        }

  12.    }

  13.    double d = max - min;

  14.    //2.初始化桶

  15.    int bucketNum = array.length;

  16.    ArrayList<LinkedList<Double>> bucketList = new ArrayList<LinkedList<Double>>(bucketNum);

  17.    for(int i = 0; i < bucketNum; i++){

  18.        bucketList.add(new LinkedList<Double>());

  19.    }

  20.    //3.遍历原始数组,将每个元素放入桶中

  21.    for(int i = 0; i < array.length; i++){

  22.        int num = (int)((array[i] - min)  * (bucketNum-1) / d);

  23.        bucketList.get(num).add(array[i]);

  24.    }

  25.    //4.对每个通内部进行排序

  26.    for(int i = 0; i < bucketList.size(); i++){

  27.        //JDK底层采用了归并排序或归并的优化版本

  28.        Collections.sort(bucketList.get(i));

  29.    }

  30.    //5.输出全部元素

  31.    double[] sortedArray = new double[array.length];

  32.    int index = 0;

  33.    for(LinkedList<Double> list : bucketList){

  34.        for(double element : list){

  35.            sortedArray[index] = element;

  36.            index++;

  37.        }

  38.    }

  39.    return sortedArray;

  40. }

  41. public static void main(String[] args) {

  42.    double[] array = new double[] {4.12,6.421,0.0023,3.0,2.123,8.122,4.12, 10.09};

  43.    double[] sortedArray = bucketSort(array);

  44.    System.out.println(Arrays.toString(sortedArray));

  45. }


代码中,所有的桶保存在ArrayList集合当中,每一个桶被定义成一个链表(LinkedList<Double>),这样便于在尾部插入元素。

定位元素属于第几个桶,是按照比例来定位:

(array[i] - min)  * (bucketNum-1) / d

同时,代码使用了JDK的集合工具类Collections.sort来为桶内部的元素进行排序。Collections.sort底层采用的是归并排序或Timsort,小伙伴们可以简单地把它们当做是一种时间复杂度 O(nlogn)的排序。




假设原始数列有n个元素,分成m个桶(我们采用的分桶方式 m=n),平均每个桶的元素个数为n/m。

下面我们来逐步分析算法复杂度:


第一步求数列最大最小值,运算量为n。

第二步创建空桶,运算量为m。

第三步遍历原始数列,运算量为n。

第四步在每个桶内部做排序,由于使用了O(nlogn)的排序算法,所以运算量为 n/m * log(n/m ) * m。

第五步输出排序数列,运算量为n。


加起来,总的运算量为 3n+m+ n/m * log(n/m ) * m = 3n+m+n(logn-logm) 。

去掉系数,时间复杂度为:

O(n+m+n(logn-logm)) 


至于空间复杂度就很明显了:

空桶占用的空间 + 数列在桶中占用的空间 = O(m+n)












有关计数排序的知识,可以看看这一篇漫画:

漫画:什么是计数排序?



—————END—————



●编号777,输入编号直达本文

●输入m获取文章目录

推荐↓↓↓

人工智能与大数据技术

更多推荐18个技术类公众微信

涵盖:程序人生、算法与数据结构、黑客技术与网络安全、大数据技术、前端开发、Java、Python、Web开发、安卓开发、iOS开发、C/C++、.NET、Linux、数据库、运维等。

登录查看更多
1

相关内容

排序是计算机内经常进行的一种操作,其目的是将一组“无序”的记录序列调整为“有序”的记录序列。分内部排序和外部排序。若整个排序过程不需要访问外存便能完成,则称此类排序问题为内部排序。反之,若参加排序的记录数量很大,整个序列的排序过程不可能在内存中完成,则称此类排序问题为外部排序。内部排序的过程是一个逐步扩大记录的有序序列长度的过程。
一份简明有趣的Python学习教程,42页pdf
专知会员服务
76+阅读 · 2020年6月22日
最新《自动微分手册》77页pdf
专知会员服务
100+阅读 · 2020年6月6日
【快讯】CVPR2020结果出炉,1470篇上榜, 你的paper中了吗?
【干货51页PPT】深度学习理论理解探索
专知会员服务
61+阅读 · 2019年12月24日
用 Python 开发 Excel 宏脚本的神器
私募工场
26+阅读 · 2019年9月8日
图解NumPy,这是理解数组最形象的一份教程了
机器之心
6+阅读 · 2019年7月12日
经验分享 | SLAM、3D vision笔试面试问题
计算机视觉life
24+阅读 · 2019年5月1日
深度学习面试100题(第71-75题)
七月在线实验室
5+阅读 · 2018年8月2日
漫画: 什么是人工智能?
大数据技术
4+阅读 · 2018年1月19日
利用 TensorFlow 实现排序和搜索算法
机器学习研究会
5+阅读 · 2017年11月23日
机器学习(26)之K-Means实战与调优详解
机器学习算法与Python学习
4+阅读 · 2017年11月19日
学员笔记||Python数据分析之:numpy入门(一)
七月在线实验室
7+阅读 · 2017年9月28日
漫画:什么是Bitmap算法?
程序猿
3+阅读 · 2017年8月19日
Music Transformer
Arxiv
5+阅读 · 2018年12月12日
The Matrix Calculus You Need For Deep Learning
Arxiv
12+阅读 · 2018年7月2日
Arxiv
5+阅读 · 2018年3月28日
Arxiv
27+阅读 · 2017年12月6日
VIP会员
相关VIP内容
一份简明有趣的Python学习教程,42页pdf
专知会员服务
76+阅读 · 2020年6月22日
最新《自动微分手册》77页pdf
专知会员服务
100+阅读 · 2020年6月6日
【快讯】CVPR2020结果出炉,1470篇上榜, 你的paper中了吗?
【干货51页PPT】深度学习理论理解探索
专知会员服务
61+阅读 · 2019年12月24日
相关资讯
用 Python 开发 Excel 宏脚本的神器
私募工场
26+阅读 · 2019年9月8日
图解NumPy,这是理解数组最形象的一份教程了
机器之心
6+阅读 · 2019年7月12日
经验分享 | SLAM、3D vision笔试面试问题
计算机视觉life
24+阅读 · 2019年5月1日
深度学习面试100题(第71-75题)
七月在线实验室
5+阅读 · 2018年8月2日
漫画: 什么是人工智能?
大数据技术
4+阅读 · 2018年1月19日
利用 TensorFlow 实现排序和搜索算法
机器学习研究会
5+阅读 · 2017年11月23日
机器学习(26)之K-Means实战与调优详解
机器学习算法与Python学习
4+阅读 · 2017年11月19日
学员笔记||Python数据分析之:numpy入门(一)
七月在线实验室
7+阅读 · 2017年9月28日
漫画:什么是Bitmap算法?
程序猿
3+阅读 · 2017年8月19日
相关论文
Music Transformer
Arxiv
5+阅读 · 2018年12月12日
The Matrix Calculus You Need For Deep Learning
Arxiv
12+阅读 · 2018年7月2日
Arxiv
5+阅读 · 2018年3月28日
Arxiv
27+阅读 · 2017年12月6日
Top
微信扫码咨询专知VIP会员