1. 算法的定义

算法是解决特定问题求解步骤的描述,在计算机中表现为指令的有限序列,并且每条指令表示一个或多个操作。

2. 算法的特性

算法具有五个基本特性:输入、输出、有穷性、确定性和可行性

2.1 输入输出

算法通常具有零个或多个输入,但至少有一个或多个输出。输出的形式可以是打印输出,也可以是返回一个或多个值。

2.2 有穷性

有穷性指算法在执行有限的步骤之后,自动结束而不会出现无限循环,并且每一个步骤在可接受的时间内完成。

2.3 确定性

确定性指算法的每一步骤都具有确定的含义,不会出现二义性。

2.4 可行性

可行性指算法的每一步都必须是可行的,也就是说每一步都能够执行有限次数完成。可行性意味着算法可以转化为程序上机运行,并得到正确的结果。

3. 算法设计的要求

算法设计的要求包括正确性、可读性、健壮性、高效率和低内存需求

3.1 正确性

算法的正确性是指算法至少应该具有输入、输出和加工处理无歧义性,能正确反映问题的需求,能够得到问题的正确答案。

  1. 算法程序没有语法错误
  2. 算法程序对于合法的输入数据能够产生满足要求的输出结果。
  3. 算法程序对于非法的输入数据能够产生满足要求的输出结果。
  4. 算法程序对于精心选择的,甚至刁难的测试数据都有满足要求的输出结果。

3.2 可读性

算法设计的另一目的是为了便于阅读、理解和交流。

3.3 健壮性

当输入数据不合法时,算法也能做出相关处理,而不是产生异常或莫名期末的结果。

3.4 时间效率高和存储量低

设计算法应该尽量满足时间效率高和存储量低的需求。

4 算法的度量方法

4.1 事后统计法

这种方法主要是通过设计好的测试程序和数据,利用计算机计时器对不同算法编制的程序的运行时间进行比较,从而确定算法效率的高低。缺点是不科学和不准确。

4.2 事前分析估算方法

在计算机程序编写前,依据统计的方法对算法进行估算。

5. 复杂度

5.1 函数的渐近增长

给定两个函数$f(n)$和$g(n)$,如果存在一个证书n,使得对于所有的$n>N$,$f(n)$总是比$g(n)$大,那么我们说$f(n)$的增长渐近快于$g(n)$。于是我们可以得出一个结论,判断一个算法好不好,我们只通过少量的数据是不能做出准确判断的,如果我们可以对比算法的关键执行次数函数的渐近增长性,基本就可以分析出:某个算法,随着n的变大,它会越来越优于另一算法,或者越来越差于另一算法。

5.2 时间复杂度

时间复杂度采用大$O$记号表示,表示函数$T(n)$的渐近上界,其中$T(n)$表示操作数量,即每行代码运行的总次数。其中,时间复杂度由$T(n)$中最高阶的项决定。常见的时间复杂度所耗时间的大小排列如下:
$$
O(1)<O(\log n)<O(n)<O(n\log n)<O(n^2)<O(2^n)<O(n!)
$$
它们分别叫做常数阶、对数阶、线性阶、线性对数阶、平方阶、指数阶、阶乘阶。

5.3 空间复杂度

空间复杂度用于衡量算法占用内存空间随着数据量变大时的增长趋势。这个概念与时间复杂度相似,只需将“运行时间”替换为“占用内存空间”。通常我们都使用“时间复杂度”来指运行时间的需求,使用“空间复杂度”指空间需求,当不用限定词地使用“复杂度”时,通常都是指时间复杂度。

参考

[1] GitHub 开源项目《hello 算法》
[2] 程杰.大话数据结构【溢彩加强版】[M].清华大学出版社,2020.