数据结构与算法系列之一:八大排序综述



[toc]

前言

  剑指offer刷完了,是时候总结一波数据结构与算法了。本系列文章暂定包括数据结构中树和图的各种操作,以及查找、排序等基本算法和动态规划等高级算法。本系列文章只是作为总结性的文献,为自己日后的面试做准备。

概述

  直接引自维基百科:排序算法。总结性强。

  在计算机科学与数学中,一个排序算法(英语:Sorting algorithm)是一种能将一串数据依照特定排序方式进行排列的一种算法。最常用到的排序方式是数值顺序以及字典顺序。有效的排序算法在一些算法(例如搜索算法与合并算法)中是重要的,如此这些算法才能得到正确解答。排序算法也用在处理文字数据以及产生人类可读的输出结果。基本上,排序算法的输出必须遵守下列两个原则:

  • 输出结果为递增序列(递增是针对所需的排序顺序而言)
  • 输出结果是原输入的一种排列、或是重组

  虽然排序算法是一个简单的问题,但是从计算机科学发展以来,在此问题上已经有大量的研究。举例而言,冒泡排序在1956年就已经被研究。虽然大部分人认为这是一个已经被解决的问题,有用的新算法仍在不断的被发明。(例子:图书馆排序在2004年被发表)

分类

  在计算机科学所使用的排序算法通常被分类为:

  • 计算的时间复杂度(最差、平均、和最好性能),依据列表(list)的大小(n)。一般而言,好的性能是O(n log n),坏的性能是O(n2)。对于一个排序理想的性能是O(n),但平均而言不可能达到。基于比较的排序算法对大多数输入而言至少需要O(n log n)。
  • 内存使用量(以及其他电脑资源的使用)
  • 稳定性:稳定排序算法会让原本有相等键值的纪录维持相对次序。也就是如果一个排序算法是稳定的,当有两个相等键值的纪录R和S,且在原本的列表中R出现在S之前,在排序过的列表中R也将会是在S之前。
  • 依据排序的方法:插入、交换、选择、合并等等。

稳定性

  当相等的元素是无法分辨的,比如像是整数,稳定性并不是一个问题。然而,假设以下的数对将要以他们的第一个数字来排序。

1
(4, 1)  (3, 1)  (3, 7)(5, 6)

  在这个状况下,有可能产生两种不同的结果,一个是让相等键值的纪录维持相对的次序,而另外一个则没有:

1
2
(3, 1)  (3, 7)  (4, 1)  (5, 6)  (维持次序)
(3, 7) (3, 1) (4, 1) (5, 6) (次序被改变)

  不稳定排序算法可能会在相等的键值中改变纪录的相对次序,但是稳定排序算法从来不会如此。不稳定排序算法可以被特别地实现为稳定。实现的一个方式是人工扩充键值的比较(比如上面的比较中加入第二个标准:第二个键值的大小),从而在键值相同的两个对象之间进行比较时,使用在原先数据次序中的条目。然而,要记录这种次序通常牵涉到额外的空间负担。

排序算法列表

  在这个表格中,n是要被排序的纪录数量以及k是不同键值的数量。

稳定的排序

  • 冒泡排序(bubble sort)— O(n2)
  • 插入排序(insertion sort)— O(n2)
  • 鸡尾酒排序(cocktail sort)— O(n2)
  • 桶排序(bucket sort)— O(n);需要O(k)额外空间
  • 计数排序(counting sort)— O(n+k);需要O(n+k)额外空间
  • 归并排序(merge sort)— O(n log n);需要O(n)额外空间
  • 原地归并排序 — O(n log2 n)如果使用最佳的现在版本
  • 二叉排序树排序(binary tree sort)— O(n log n)期望时间;O(n2)最坏时间;需要O(n)额外空间
  • 鸽巢排序(pigeonhole sort)— O(n+k);需要O(k)额外空间
  • 基数排序(radix sort)— O(n·k);需要O(n)额外空间
  • 侏儒排序(gnome sort)— O(n2)
  • 图书馆排序(library sort)— O(n log n)期望时间;O(n2)最坏时间;需要(1+ε)n额外空间
  • 块排序(block sort)— O(n log n)

不稳定的排序

  • 选择排序(selection sort)— O(n2)
  • 希尔排序(shell sort)— O(n log2 n)如果使用最佳的现在版本
  • Clover排序算法(Clover sort)— O(n)期望时间,O(n2)最坏情况
  • 梳排序 — O(n log n)
  • 堆排序(heap sort)— O(n log n)
  • 平滑排序(smooth sort)— O(n log n)
  • 快速排序(quick sort)— O(n log n)期望时间,O(n2)最坏情况;对于大的、随机数列表一般相信是最快的已知排序
  • 内省排序(introsort)—O (n log n)
  • 耐心排序(patience sort)— O(n log n + k)最坏情况时间,需要额外的O(n + k)空间,也需要找到最长的递增子序列(longest increasing subsequence)

不实用的排序

  • Bogo排序 — O(n × n!),最坏的情况下期望时间为无穷
  • Stupid排序 — O(n3);递归版本需要O(n2)额外内存
  • 珠排序(bead sort)— O(n) or O(√n),但需要特别的硬件
  • 煎饼排序 — O(n),但需要特别的硬件
  • 臭皮匠排序(stooge sort)算法简单,但需要约n^2.7的时间

==概述到此结束,下面分八篇文章依次对典型的八种排序进行图文并茂的讲解和c++实现。==


  先贴一下八大排序的性能概括图:



  再贴出来以后要用到的main函数和头文件。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
#include <iostream>
#include <algorithm>
#include <stdexcept>
#include <stack>
#include <cstdio>
#include <cstring>
using namespace std;
#define M 5

int main() {
int arr[] = {2,4,6,8,9,7,5,3,1};
int len = sizeof(arr) / sizeof(*arr);
// double arr[] = {4.5, 2.3,6.7, 3.5, 1.1};
// const int len = sizeof(arr) / sizeof(arr[0]);
// BubbleSort(arr, len);
// BubbleSort1(arr, len);
// BubbleSort2(arr, len);
// BubbleSort3(arr, len);
// InsertSort(arr, len);
// ShellSort(arr, len);
// QuickSort(arr, len);
// QuickSortIteration(arr, len);
// SelectSort(arr, len);
// HeapSort(arr, len);
// MergeSort(arr, len);
MergeSortIteration(arr, len);

for(auto v : arr){
cout << v << " ";
} cout << endl;
}

  最后就要打开传送门了:

csdn告诉我今天上传博客的次数到达上限了,然而我还有两个没有上传,那我只好先引流到我的个人博客了。

  • 插入排序:(有序区,无序区)。把无序区的第一个元素插入到有序区的合适的位置。对数组:比较得少,换得多。
  • 希尔排序:每一轮按照事先决定的间隔进行插入排序,间隔会依次缩小,最后一次一定要是1。
  • 选择排序:(有序区,无序区)。在无序区里找一个最小的元素跟在有序区的后面。对数组:比较得多,换得少。
  • 堆排序:(最大堆,有序区)。
    从堆顶把根卸出来放在有序区之前,再恢复堆。
  • 冒泡排序:(无序区,有序区)。从无序区通过交换找出最大元素放到有序区前端。
  • 快速排序:(小数,基准元素,大数)。
    在区间中随机挑选一个元素作基准,将小于基准的元素放在基准之前,大于基准的元素放在基准之后,再分别对小数区与大数区进行排序。
  • 归并排序:把数据分为两段,从两段中逐个选最小的元素移入新数据段的末尾。
    可从上到下或从下到上进行。
  • 基数排序:一种多关键字的排序算法,可用桶排序实现。

参考链接:
维基百科
数据结构与算法可视化可视化
数据结构与算法
排序算法可视化
经典排序算法总结与实现

0%