blog/source/_posts/time-complexity.md

---
title: 时间复杂度
date: 2021-04-10 20:52:59
tags: [架构知识, 算法设计, 大O符号表示法, 时间复杂度, Python]
categories:
  - [架构知识, 算法设计]
mathjax: true
keywords: 算法设计,时间复杂度,大O符号表示法,线性阶,平方阶,线性对数阶
---
时间复杂度是我们衡量和筛选算法的一个常用考量维度，如何理解并使用它，是我们日常工作学习中常常会用到的，但是只要一段时间不用它是会很快被忘记的。所以这里把时间复杂度的概念简要记录一下，方便使用的时候能够快速恢复记忆。<!--more-->

对于算法的衡量一般是从两个维度进行的，一是空间维度，即算法执行所需要占据的内存空间；一是时间维度，即算法执行所需要的时间。时间与空间往往不能兼得，我们很难设计一个既使用很小的空间又能迅速执行的算法，所以在面临时间与空间的选择时，我们往往会选择更加宝贵的时间，毕竟一根内存条还是有价的。

## 大O符号表示法

对于时间复杂度的衡量，我们最常见的就是使用**大O符号表示法**，例如$O(1)$、$O(n)$等。之所以采用这样的方式衡量，是因为在不同配置的计算机上，相同的算法代码所呈现出来的性能也不尽相同。所以引入**大O符号表示法**可以使算法执行所消耗的时间标准化，更加易于对比。

**大O符号表示法**的完整格式是$T(n)=O(f(n))$，这个函数表示的是代码执行次数与所使用时间之间的正比例关系。其中$f(n)$表示算法中每行代码执行次数的和，$O()$表示一个正比例关系。所以**大O符号表示法**所表示的是算法执行时间的增长变化趋势的，而不是算法实际的执行时间。在使用**大O符号表示法**的时候，我们一般会假设算法中每一行代码的执行时间都是一样，也就是一个单位时间会运行一行代码，这样我们就能够方便的计算$f(n)$了。

在$f(n)$中，如果$n$趋近$+\infty$，那么$f(n)$中所有的常量都将变得没有意义，所以常用$T(n)=O(n)$来表示实际的时间复杂度。在这种简化的表示形式下，如果$O(n)$中的$n$变化越剧烈，则说明时间复杂度越大，例如$n^3$就比$n$的变化要剧烈的多，所以$T(n)=O(n^3)$就表示随着代码量的增长，算法所消耗的时间以代码量增长速度的三次方速度增长，这足以看出这个算法的时间复杂度。

> **大O符号表示法**从来都不是一个精确的表示法，不要用它来做精确的计算。

## 常见时间复杂度量级

一般在代码设计中常常出现的时间复杂度量级主要有以下这些：

- 常数阶$O(1)$。
- 对数阶$O(logN)$。
- 线性阶$O(n)$。
- 线性对数阶$O(nlogN)$。
- 平方阶$O(n^2)$。
- 立方阶$O(n^3)$。
- K方阶$O(n^k)$。
- 指数阶$O(2^n)$。
- 组合阶$O(n!)$。

以上这些复杂度量级从上到下所表示的复杂度越来越大，执行效率也越来越低。下面就一些示例来说明不同形式的代码其时间复杂度的量级。

### 常数阶

代码中没有循环结构，无论执行多少行，代码所消耗的时间始终固定，不随着某个变量的操作发生变化，其复杂度就是$O(1)$。例如：

```python
i = 1
j = 2
i += 1
j += 2
```

### 线性阶

代码中只有一层循环结构，没有任何嵌套的循环结构，代码执行所消耗的时间只与循环控制变量线性相关，那么这段代码的复杂度就是$O(n)$。例如：

```python
j = 0
for i in range(1000):
    j += i
```

在线性阶$O(n)$中，每个单位时间中算法能够处理的变量数量是固定的，算法所处理的变量数量随时间线性增长。这一点需要牢记，否则将难以理解对数阶。

### 对数阶

代码中同样只有一层循环结构，没有任何嵌套的循环结构，但是代码执行所消耗的时间与循环控制变量指数相关，那么这段代码的复杂度就是$O(logN)$。例如：

```python
n = 100
i = 1
while i < n:
    i *= 2
```

在这段代码中，循环不是线性的，循环在$2^n$次之后就会退出，所以这段代码的时间复杂度就是$O(log2^n)$，所以可以简化表示为$O(logN)$。对数阶量级主要表示随着时间的增加，所处理的n是以指数方式增加的情况。在这个方面，二叉树检索等算法都属于对数阶量级，这个量级的复杂度要比线性阶轻量。

### 线性对数阶

线性对数阶量级中就已经开始出现多层的循环结构了，在复杂度为$O(nlogN)$量级的代码中，有两层循环结构，其中一层为$O(n)$量级的循环，一层为$O(logN)$量级的循环。例如：

```python
for i in range(10000):
    n = 1
    while n < i:
        n *= 2
```

在这种嵌套的循环结构中，其复杂度的计算方法是各层的复杂度相乘，即：$O(n) \times O(logN)$，这样相乘所得到的结果就是$O(nlogN)$。比较常见的快速排序算法的复杂度就是线性对数阶。

### K方阶

从线性对数阶量级中可以看出，多层循环在进行嵌套的时候，算法复杂度也是逐步相乘的，所以$O(n^2)$、$O(n^3)$和$O(n^k)$这三个量级就十分容易理解了。K方阶量级中的指数$k$可以直接认为代码中做了$k$层的循环。例如：

```python
for i in range(1000):
    for j in range(2000):
        for k in range(3000):
            n *= 2    # 不要真的去运行，计算机会炸的
```

在这个示例中使用了一个三层的循环，所以这段代码的复杂度就应该是$O(i) \times O(j) \times O(k)$，简化以后就是$O(n \times n \times n)=O(n^3)$。

但一段代码使用了K方阶量级的复杂度以后，一般就说明这段代码需要进行优化了，并且K方阶的代码在一般情况下总可以找到低复杂度的优化实现。但我们一般所常用的排序算法大多是$O(n^2)$阶复杂度，所以如果一段代码是二方阶复杂度，或者三方阶复杂度且不过分要求时间，可以选择不进行优化。