## 10.1 枚举法
问题求解中常用的一种算法设计方法是枚举策略。给定问题 P,如果知道 P 的可能解构 成一个有限集合 S = {s1, s2, ..., sn},则可以逐一列举每个 si,检验它是否确实是 P 的解,这 就是枚举法。枚举法简单而直接,算法容易设计实现,但当可能解集合 S 很大时,枚举策 略的效率很差。实际使用枚举法时,经常利用各种已知条件来从 S 中排除掉一部分不可能 情形,从而优化枚举过程。下面通过几个例子来说明枚举策略在设计算法中的应用。
线性搜索
首先看一个程序设计中常见的问题——搜索(或称查找)问题:给定数据集合 D,在 D 中查找指定数据 x。
搜索问题看上去很容易解决,一个显而易见的做法是:反复从 D 中读取下一个数据, 看看它是否 x,搜索结果是要么找到 x,要么发现 D 中没有 x。然而,这个“算法”是有问 题的,因为它需要一个关键操作——“读取取下一个数据”,而“下一个”未必是良定义的。 打个比方,如果一群人站成一排,当我们要从中找出张三时,可以采取按排队次序逐个询问 的策略。但如果这群人散乱无规则地站在一起,我们该如何循着一个有条理的过程找出张三 来呢?如何决定“下一个”要询问的人?
可见,要想在一个数据集合中找到指定数据,就必须能够按某种系统化的方式逐个列举 集合元素,并与指定数据进行比较。这就是枚举策略在搜索问题中的应用。
如果将大量数据存储在一个列表中,则使用枚举策略很合适,因为列表是通过位置索引 来访问其中数据成员的,“读取下一个数据”是良定义的操作,只要将当前位置索引加 1 即 可得下一个数据的索引。下面定义的函数 find()实现了这种搜索策略:给定数据列表 list 和 需要查找的数据 x,逐个取出 list 的成员并与 x 进行比较。如果某个成员就是 x,则返回该 成员在列表中的位置索引;如果 list 中没有 x 则返回-1。
```
>>> def find(list,x):
for i in range(len(list)): if list[i] == x:
return i return -1
>>> find([2,4,6,8],6) 2
>>> find([2,4,6,8],7)
-1
```
find()函数对列表 list 从头到尾进行扫描,扫描过程中检验每一个成员是否 x,这个算法 称为线性搜索(linear search)算法。线性搜索算法很容易设计实现,而且当数据量不太大时,算法的性能也还可以。更重要的是,由于线性搜索是枚举每一个数据成员,因此适用于 无序数据集合,即数据没有按特定的大小次序排列。
然而,当数据量很大时,逐个枚举集合中的数据就变得非常低效。这时只能通过更好地 组织数据,利用额外信息来提高搜索效率,尽量避免逐个检查所有数据。例如,假设列表数 据从小到大有序排列,那么在枚举过程中一旦发现当前取出的数据大于 x,就不必再继续搜 索了,可以直接下结论说找不到 x。这种改进可以提高线性搜索算法的性能,但改善得很有 限。事实上,在数据有序的情况下,存在比线性搜索算法好得多的算法(见 10.2)。
线性搜索算法只适用于“一维”搜索空间,即所有数据排列成一排的情形。考虑在如下 矩阵中查找某个数据的问题:
![](https://box.kancloud.cn/2016-02-22_56cafce705821.png)
这时显然无法直接采用线性搜索算法。在类似矩阵这样的“二维”搜索空间中,如何枚举每 一个数据呢?这个问题其实在第 3 章中介绍循环语句时就讨论过,为了遍历(即枚举)这样 的二维空间,可以采用嵌套的循环语句。例如下面这个 find2D()函数实现了在 row 行、col 列的矩阵 matrix 中查找数据 x 的枚举算法:
```
>>> def find2D(matrix,row,col,x):
for i in range(row):
for j in range(col):
if matrix[i][j] == x:
return (i+1,j+1)
return -1
>>> find2D([[1,2,3],[4,5,6]],2,3,6) (2, 3)
>>> find2D([[1,2,3],[4,5,6]],2,3,7)
-1
```
显然,这个做法可以扩展到更多维的搜索空间,利用 n 层嵌套循环即可枚举 n 维搜索空 间中的数据。
求解不定方程
有时问题的所有可能解并没有像上例那样明确地存储在某个具体集合(如列表)中,而 是构成一个无形的搜索空间,那该如何枚举可能解呢?这需要具体问题具体分析,根据问题 的特点设计枚举方式。下面是一个典型的例子。
中国古代数学著作中有一道“百钱买百鸡”问题:假设公鸡每只 5 元钱,母鸡每只 3
元钱,鸡雏每三只 1 元钱,用一百元钱买了一百只鸡,问公鸡、母鸡和鸡雏各买了几只?具 备初等代数知识的人都不难列出如下方程组来求解这个问题:
```
x + y + z = 100
5x + 3y + z/3 = 100
```
其中 x、y、z 分别表示公鸡、母鸡和鸡雏的个数。 此方程组有三个未知数却只有两个方程式,属于数学中所称的不定方程。人工求解不定
方程通常会利用方程变形、未知数代换以及分析各种约束条件等技巧,而绝不会采用枚举所 有可能解进行检验的方法,因为可能解构成的空间通常非常庞大。然而,计算机的优点恰恰 在于能够高速地、机械地执行大量的检验任务,因此采用枚举策略来解不定方程是简单而直 接的做法。问题是如何枚举各种可能解呢?对于百钱买百鸡问题,显然只需为三个未知数做 各种可能的赋值,然后检查是否满足上述两个方程式即可。各未知数的可能值都在 100 之内(因为只买了 100 只鸡),所以利用枚举法很容易得到下列程序:
```
>>> for x in range(100):
for y in range(100):
for z in range(100):
t = x + y + z
m = 5*x + 3*y + z/3
if t == 100 and m == 100:
print "x=",x,",y=",y,",z=",z
x= 0 ,y= 25 ,z= 75
x= 3 ,y= 20 ,z= 77
x= 4 ,y= 18 ,z= 78
x= 7 ,y= 13 ,z= 80
x= 8 ,y= 11 ,z= 81
x= 11 ,y= 6 ,z= 83
x= 12 ,y= 4 ,z= 84
```
采用枚举策略时应当尽量减小可能解集合,以便提高枚举效率。上面这个程序的效率显 然太差,因为三重嵌套循环实际上要枚举 100×100×100 种 x、y、z 组合。其实稍加思考就 能找到减小需要检验的可能解的数目的方法。首先,不需要三层嵌套循环,因为当 x 和 y 的值给定,z 的值就确定了(即 100–x–y),没有必要再去枚举 z;其次,x 的可能值不超 过 20(否则钱不够),同理 y 的可能值不超过 33;最后,依题意每种鸡应当都至少买 1 只, 没有必要考虑等于 0 的情形。将这些分析落实到编程中,即可得效率更高的代码:
```
>>> for x in range(1,20):
for y in range(1,33):
z = 100 - x - y
m = 5*x + 3*y + z/3
if m == 100:
print "x=",x,",y=",y,",z=",z
x= 3 ,y= 20 ,z= 77
x= 4 ,y= 18 ,z= 78
x= 7 ,y= 13 ,z= 80
x= 8 ,y= 11 ,z= 81
x= 11 ,y= 6 ,z= 83
x= 12 ,y= 4 ,z= 84
```
利用问题中的各种约束条件往往可以减少搜索空间或者优化枚举过程。例如,假设为 “百钱买百鸡”问题附加一个条件“尽量多买公鸡”,那么可以这样优化算法:最外层对 x 的循环中改用 range(20,0,-1),以便尽快找到满足条件的值,得到第一个解之后就可以 终止程序,不必再找其他解了。
通过以上例子,我们看到枚举算法的核心思想是对问题的每一个可能解进行检验,看看 是否满足特定条件,这个枚举过程在编程时是通过循环语句和条件语句实现的。对于一些复 杂问题,如果嵌套循环的层数不确定或者层数太多,直接使用循环语句和条件语句实现枚举 检验是不合适甚至不可能的,这时可以考虑采用递归技术(见 10.2)。
当问题规模较大时,可能解的空间也很大,采用枚举策略会导致效率很差。但是,鉴于 枚举算法设计简单,调试也容易,对于规模较小的问题是很好的策略。即使对于大规模的复 杂问题,枚举策略也可以作为整体求解算法的子算法出现。
最后总结一下采用枚举策略设计算法的一般步骤:
(1) 确定枚举对象、枚举范围和判定条件;
(2) 枚举各可能解,逐一验证是否所需的问题解。
(3) 尽量减小枚举范围,提高算法效率。
- 前言
- 第 1 章 计算与计算思维
- 1.1 什么是计算?
- 1.1.1 计算机与计算
- 1.1.2 计算机语言
- 1.1.3 算法
- 1.1.4 实现
- 1.2 什么是计算思维?
- 1.2.1 计算思维的基本原则
- 1.2.2 计算思维的具体例子
- 1.2.3 日常生活中的计算思维
- 1.2.4 计算思维对其他学科的影响
- 1.3 初识 Python
- 1.3.1 Python 简介
- 1.3.2 第一个程序
- 1.3.3 程序的执行方式
- 1.3.4 Python 语言的基本成分
- 1.4 程序排错
- 1.5 练习
- 第 2 章 用数据表示现实世界
- 2.1 数据和数据类型
- 2.1.1 数据是对现实的抽象
- 2.1.1 常量与变量
- 2.1.2 数据类型
- 2.1.3 Python 的动态类型*
- 2.2 数值类型
- 2.2.1 整数类型 int
- 2.2.2 长整数类型 long
- 2.2.3 浮点数类型 float
- 2.2.4 数学库模块 math
- 2.2.5 复数类型 complex*
- 2.3 字符串类型 str
- 2.3.1 字符串类型的字面值形式
- 2.3.2 字符串类型的操作
- 2.3.3 字符的机内表示
- 2.3.4 字符串类型与其他类型的转换
- 2.3.5 字符串库 string
- 2.4 布尔类型 bool
- 2.4.1 关系运算
- 2.4.2 逻辑运算
- 2.4.3 布尔代数运算定律*
- 2.4.4 Python 中真假的表示与计算*
- 2.5 列表和元组类型
- 2.5.1 列表类型 list
- 2.5.2 元组类型 tuple
- 2.6 数据的输入和输出
- 2.6.1 数据的输入
- 2.6.2 数据的输出
- 2.6.3 格式化输出
- 2.7 编程案例:查找问题
- 2.8 练习
- 第 3 章 数据处理的流程控制
- 3.1 顺序控制结构
- 3.2 分支控制结构
- 3.2.1 单分支结构
- 3.2.2 两路分支结构
- 3.2.3 多路分支结构
- 3.3 异常处理
- 3.3.1 传统的错误检测方法
- 3.3.2 传统错误检测方法的缺点
- 3.3.3 异常处理机制
- 3.4 循环控制结构
- 3.4.1 for 循环
- 3.4.2 while 循环
- 3.4.3 循环的非正常中断
- 3.4.4 嵌套循环
- 3.5 结构化程序设计
- 3.5.1 程序开发过程
- 3.5.2 结构化程序设计的基本内容
- 3.6 编程案例:如何求 n 个数据的最大值?
- 3.6.1 几种解题策略
- 3.6.2 经验总结
- 3.7 Python 布尔表达式用作控制结构*
- 3.8 练习
- 第 4 章 模块化编程
- 4.1 模块化编程基本概念
- 4.1.1 模块化设计概述
- 4.1.2 模块化编程
- 4.1.3 编程语言对模块化编程的支持
- 4.2 Python 语言中的函数
- 4.2.1 用函数减少重复代码 首先看一个简单的用字符画一棵树的程序:
- 4.2.2 用函数改善程序结构
- 4.2.3 用函数增强程序的通用性
- 4.2.4 小结:函数的定义与调用
- 4.2.5 变量的作用域
- 4.2.6 函数的返回值
- 4.3 自顶向下设计
- 4.3.1 顶层设计
- 4.3.2 第二层设计
- 4.3.3 第三层设计
- 4.3.4 第四层设计
- 4.3.5 自底向上实现与单元测试
- 4.3.6 开发过程小结
- 4.4 Python 模块*
- 4.4.1 模块的创建和使用
- 4.4.2 Python 程序架构
- 4.4.3 标准库模块
- 4.4.4 模块的有条件执行
- 4.5 练习
- 第 5 章 图形编程
- 5.1 概述
- 5.1.1 计算可视化
- 5.1.2 图形是复杂数据
- 5.1.3 用对象表示复杂数据
- 5.2 Tkinter 图形编程
- 5.2.1 导入模块及创建根窗口
- 5.2.2 创建画布
- 5.2.3 在画布上绘图
- 5.2.4 图形的事件处理
- 5.3 编程案例
- 5.3.1 统计图表
- 5.3.2 计算机动画
- 5.4 软件的层次化设计:一个案例
- 5.4.1 层次化体系结构
- 5.4.2 案例:图形库 graphics
- 5.4.3 graphics 与面向对象
- 5.5 练习
- 第 6 章 大量数据的表示和处理
- 6.1 概述
- 6.2 有序的数据集合体
- 6.2.1 字符串
- 6.2.2 列表
- 6.2.3 元组
- 6.3 无序的数据集合体
- 6.3.1 集合
- 6.3.2 字典
- 6.4 文件
- 6.4.1 文件的基本概念
- 6.4.2 文件操作
- 6.4.3 编程案例:文本文件分析
- 6.4.4 缓冲
- 6.4.5 二进制文件与随机存取*
- 6.5 几种高级数据结构*
- 6.5.1 链表
- 6.5.2 堆栈
- 6.5.3 队列
- 6.6 练习
- 第 7 章 面向对象思想与编程
- 7.1 数据与操作:两种观点
- 7.1.1 面向过程观点
- 7.1.2 面向对象观点
- 7.1.3 类是类型概念的发展
- 7.2 面向对象编程
- 7.2.1 类的定义
- 7.2.2 对象的创建
- 7.2.3 对象方法的调用
- 7.2.4 编程实例:模拟炮弹飞行
- 7.2.5 类与模块化
- 7.2.6 对象的集合体
- 7.3 超类与子类*
- 7.3.1 继承
- 7.3.2 覆写
- 7.3.3 多态性
- 7.4 面向对象设计*
- 7.5 练习
- 第 8 章 图形用户界面
- 8.1 图形用户界面概述
- 8.1.1 程序的用户界面
- 8.1.2 图形界面的组成
- 8.1.3 事件驱动
- 8.2 GUI 编程
- 8.2.1 UI 编程概述
- 8.2.2 初识 Tkinter
- 8.2.3 常见 GUI 构件的用法
- 8.2.4 布局
- 8.2.5 对话框*
- 8.3 Tkinter 事件驱动编程
- 8.3.1 事件和事件对象
- 8.3.2 事件处理
- 8.4 模型-视图设计方法
- 8.4.1 将 GUI 应用程序封装成对象
- 8.4.2 模型与视图
- 8.4.3 编程案例:汇率换算器
- 8.5 练习
- 第 9 章 模拟与并发
- 9.1 模拟
- 9.1.1 计算机建模
- 9.1.2 随机问题的建模与模拟
- 9.1.3 编程案例:乒乓球比赛模拟
- 9.2 原型法
- 9.3 并行计算*
- 9.3.1 串行、并发与并行
- 9.3.2 进程与线程
- 9.3.3 多线程编程的应用
- 9.3.4 Python 多线程编程
- 9.3.5 小结
- 9.4 练习
- 第 10 章 算法设计和分析
- 10.1 枚举法
- 10.2 递归
- 10.3 分治法
- 10.4 贪心法
- 10.5 算法分析
- 10.5.1 算法复杂度
- 10.5.2 算法分析实例
- 10.6 不可计算的问题
- 10.7 练习
- 第 11 章 计算+X
- 11.1 计算数学
- 11.2 生物信息学
- 11.3 计算物理学
- 11.4 计算化学
- 11.5 计算经济学
- 11.6 练习
- 附录
- 1 Python 异常处理参考
- 2 Tkinter 画布方法
- 3 Tkinter 编程参考
- 3.1 构件属性值的设置
- 3.2 构件的标准属性
- 3.3 各种构件的属性
- 3.4 对话框
- 3.5 事件
- 参考文献