码迷,mamicode.com
首页 > 其他好文 > 详细

DSA_02:复杂度分析

时间:2020-03-28 13:15:26      阅读:91      评论:0      收藏:0      [点我收藏+]

标签:tar   多少   占用   遍历   col   查找   有一个   一般来说   style   

真正掌握了复杂度分析,可以说 DSA 便掌握了一小半。

 

复杂度分析分为:时间复杂度分析、空间复杂度分析。

 

时间复杂度的定义:

  并不是指代码执行的具体、确定时间。

  它表示的是一个算法执行效率与数据规模增长的变化趋势。

  即便代码需要执行成千上万次,只要它不随数据规模变化而变化,那么它的复杂度就是 O(1)。

空间复杂度的定义:
  类似的,它表示空间占用与数据规模增长的变化趋势

  同样,哪怕占用再多的空间,只要它不随数据规模变化而变化,那么它的复杂度就是 O(1)。

 

复杂度的两种表示方法:

  1. T(n) 表示法:表示算法随数据规模增长的确切公式,如:T(n) = 4n^2 + 3n + 2。

  2. O(n) 表示法:去掉 T(n) 中的常数和低量级,只留下最大的量级,如上式:O(n) = n^2。

  3. 同样,若 T(n) = 1000000n^2,O(n) 同样为 n^2。

  4. 最常用的 O(n) 表示法。

  5. 常数复杂度是 O(1),不存在 O(100),O(1000)等。

  6. 我们常说的复杂度 logn,其底数到底是多少呢?

    答:一般来说是 2 为底。如果是 5,7,10 等值为底,由高中数学换底公式知道,可以转化为 一个常数*以 2 为低的对数,因此可去掉常数。 

 

以下给出一些常用的复杂度(这几乎包含了所有你会遇到的复杂度):

  由低至高:O(1)、O(logn)、O(n)、O(nlogn)、O(n^2)、O(n^3)、O(n^k)、O(2^n)、O(n!)。

  两个特殊的复杂度(由两个数据规模决定):O(m+n)、O(mn)。

  空间复杂度会比时间复杂度更简单,常用的有:O(1)、O(n)、O(n^2)

 

一般的复杂度分析笔者就不再啰嗦了,下面重点讲解一下复杂度分析中的:最好最坏平均均摊 时间复杂度

先看一个例子:从一个无序数组中查找某个值是否存在,若存在,则返回下标,否则返回 -1(以 C/C++ 代码给出,不涉及高级语法,相信完全可以看懂)。

// n 是数组大小
int find(int arr[], int n, int target)
{
    int pos = -1;
    for (int i = 0; i < n; ++i)
        if (arr[i] == target) pos = i;
    return pos;
}

你可以看出,需要遍历整个数组,其时间复杂度是 O(n),空间复杂度是 O(1)。

当然你肯定也看处问题了,这段代码可以优化,即找到后提前退出:

// n 是数组大小
int find(int arr[], int n, int target)
{
    int pos = -1;
    for (int i = 0; i < n; ++i)
    {
        if (arr[i] == target)
        {
            pos = i;
            break;
        }
    }
    return pos;
}

那么问题来了,优化后的时间复杂度还是 O(n) 吗??

现在引出主题:

  1. 最好时间复杂度:第一个元素就是我们要查找的,因此时间复杂度是 O(1)

  2. 最坏时间复杂度:最后一个元素是我们要查找的,或 target 不在数组内,时间复杂度 O(n)。

  3. 平均复杂度:

    要查找的变量在数组中的位置,有n+1种情况:在数组的0~n-1位置中和不在数组中。

    我们把每种情况下,查找需要遍历的元素个数累加起来,然后再除以n+1, 就可以得到需要遍历的元素个数的平均值,即:

      (1+2+3+...+n-1+n+n) / (n+1) = (n(n+3)) / (2(n+1))  即:O(n)

    前面的推导过程中存在的最大问题就是,没有将各种情况发生的概率考虑进去,如果 target 在数组中的概率为 1/2 会怎么样呢?1/3 呢? 1/5 呢?

    我们以 1/2 为例计算:

      (1 * 1/2n + 2 * 1/2n +...+ n * 1/2n + n * 1/2) = (3n+1) / 4  即:O(n)

    尽管上面方法得出的结果均为 O(n),但是我们需要根据实际情况,通常不能丢弃概率。

 

再看一个例子:有一个数组,当压入数据时数组空间不足了,就将数组扩大至原大小的两倍,将原数据拷贝到新数组中去。

这个操作复杂度是多少呢?

首先要明确:数组空间充足时,压入数组的时间复杂度为 O(1),当空间不足时,需要重新开辟空间,并将原有的 n 个数据拷贝过来,时间复杂度 O(n)。

但是怎么评估整体复杂度呢?

这就用到最后一点:均摊时间复杂度

将一次开辟消费的 O(n) 复杂度,均摊给后面 n-1 次的 O(1) 复杂度,不难得出,均摊复杂度为 O(1)。

这是很重要的复杂度分析方法,后续还会提及。

 

DSA_02:复杂度分析

标签:tar   多少   占用   遍历   col   查找   有一个   一般来说   style   

原文地址:https://www.cnblogs.com/teternity/p/DSA_02.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!