## 10.4 贪心法
考虑一个应用问题:假设需要在油库 A 和加油站 B、C、D、E、F、G、H 之间修建输 油管道,油库和各加油站的位置如图 10.6 所示,图中的虚线表示可能的管道铺设路线,虚 线旁标注的数值表示所需铺设的管道的长度(千米)②。例如油库 A 与加油站 B 之间需要铺 设 35 千米的管道。
![](https://box.kancloud.cn/2016-02-22_56cafce79d1c8.png)
图 10.6 油库及加油站位置示意图
显然没有必要在所有可能路线上铺设管道,而只需要各加油站直接或间接与油库连通即可。假设人手和资金比较紧张,工程只能分批分期进行,每期建设一条管道。我们该如何规 划整个工程呢?
> ① 术语称为引用传递,以区别于普通的值传递。参见第 6 章。
> ② 此处的长度数据不一定是两点之间的直线距离,所以不要根据三角不等式(三角形中两边之和大于第三 边)得出数据不合理的结论。
指导思想当然是又快又省钱。一种想法是尽可能快地使加油站投入使用,每一期工程都 使一个加油站能够供油。那么,第一期必须在油库 A 与某个加油站之间铺设管道,问题是 选哪个加油站呢?显然应该选择 B,因为在从 A 可直接到达的 B、C、D、E 中,AB 是最短 的管道,可以在最短时间内建成,当然花费也是最少的。接下来考虑第二期工程时,可以选择一个从 A 或者 B 可到达的加油站,注意此时所选加油站不必与油库 A 直接相通,间接连 通也能保证供油。C、D、E、G 都是从 A 或 B 可通达的加油站,其中 C 是最近的,因此我 们选择 C,并铺设 B 和 C 之间的 15 千米管道。在工程的第三期,需要选择一个能与 A、B 或 C 可到达的加油站,这次最短的是 C 和 D 之间的 5 千米管道,因此选择 D 并铺设 CD 管 道。到目前为止,工程进展如图 10.7 所示,图中实线段表示已经铺设的管道,B、C、D 都 能供油了。
![](https://box.kancloud.cn/2016-02-22_56cafce7b2b7d.png)
图 10.7 第三期工程后的状况 依此类推,在接下去的第四期到第七期工程中,可以分别铺设 CG、GH、FH 和 FE 之间的管道。至此,所有加油站都通过输油管道与油库 A 连通了,如图 10.8 所示。工程规划 者一定很满意,因为他们觉得自己在每一期建设中都选择了当时情况下最短的线路,从而能 以最快时间完成那一期工程,使一个新加油站投入运营。当工程完工时,铺设管道的总长度 是 150 千米。
![](https://box.kancloud.cn/2016-02-22_56cafce7c58ae.png)
图 10.8 完工后的状况
下面考虑另一种工程建设方案。工程规划者并不追求各加油站尽快投入使用,而一心只想以最小的投资完成工程。这时的指导思想是,每一期工程都尽可能选择当前所有线路中最 短的线路来铺设管道,并确保最终能将油库和所有加油站连通起来。
按照这个思路,首先应该选择铺设 CD 管道,因为这条管道的长度是 5 千米,是所有管 道线路中最短的。完成 CD 管道之后,剩余线路中最短的管道是 10 千米的 FH,因此选择它 作为第二条铺设的管道。依此类推,接下去应该分别铺设 BC(15 千米)、GH(20 千米)和 CG(25 千米)等管道,至此工程现状如图 10.9 所示。
![](https://box.kancloud.cn/2016-02-22_56cafce7d9614.png)
图 10.9 铺设五条最短管道之后的状况
按照上述思路接下来应该铺设当前最短的 CF 管道(30 千米),但由于 C 和 F 已经连入 了输油管道系统,再铺设 CF 管道属于重复建设,因此我们放弃 CF 而选择铺设 AB 管道(35 千米)。最后一步铺设 EF 管道(40 千米),至此油库和所有加油站都连通了,如图 10.10 所 示。
![](https://box.kancloud.cn/2016-02-22_56cafce7c58ae.png)
图 10.10 完工后的状况 读者一定已经发现,第二种以省钱为指导思想的建设方案与第一种以尽快投入运营为指
导思想的建设方案所导致的输油管道系统是一样的,两者都铺设了总长度为 150 千米的管 道。问题是这两种建设方案到底是不是最优的呢?会不会有一种管道总长度更小的方案呢? 读者不妨试试其他选择,最终会发现任何其他将油库和加油站连接在一起的方案都导致总长 度超过 150 千米的管道系统。所以,我们讨论的两种方案都导致了最优的(即总长度最小) 输油管道系统。
不难看出,实际中的许多问题都可以利用上述方案来解决,如下水道系统、芯片设计、 交通网、通信网等等。这些问题可以抽象成图论中的“最小支撑树”问题,上面两种解决方 案其实是解决最小支撑树问题的两个著名算法的应用。
第一种方案称为 Prim 算法,其思想是从一个地点(如油库)出发,一个接一个地将其 他地点(如加油站)连入系统,其中每一步都尽可能选择最短连接路线。Prim 算法的伪代 码如下:
```
Prim 算法
1\. 初始时所有地点标记为不可通达。
2\. 选择一个特定地点,标记为可通达。
3\. 重复下列步骤,直至所有地点都被标记为可通达:
选择距离最近的两个地点,其中一个地点的标记是可通达,另一个地点的标记是不可通 达。然后将这两个地点连接起来,并将原先不可通达的地点改标为可通达。
```
第二种策略称为 Kruskal 算法,其思想是每一步将当前距离最近且尚未连通的两个地点 连接起来。如果某一步的当前最小长度线路所涉及的两个地点已经连通了,则放弃这个路线, 接着考虑其后线路。算法伪代码如下:
```
Kruskal 算法
重复以下步骤,直至所有地点都直接或间接地连通:
将当前距离最近并且尚未连通的两个地点连接起来。
```
Prim 算法和 Kruskal 算法虽然是不同的解决方法,但他们都能产生最小支撑树。这两个 算法其实反映了一个共同的算法设计方法——贪心法。贪心法指的是这样一种问题求解策 略:在求解过程的每一步都尽量作出在当前情况下局部最优的选择,以期最终能得到全局最 优解。例如 Prim 算法在每一步都选择当前与已连通部分最近的地点,Kruskal 算法在每一步 都尽可能选择当前最短的线路,两者的最终目标都是构造最小支撑树。
贪心算法的一般模式是通过迭代(循环)来一步一步地进行贪心选择,从而产生一个局 部最优解,并将问题简化为更小的问题,最终的全局解由所有局部解组成。即:
```
贪心算法模式
算法:
输入:一个候选对象集合
输出:由某些候选对象组成的全局解
重复以下步骤,直至得到全局解:
从候选对象中选择当前最优者,并加入到局部解中
```
在迭代的每一步,贪心选择可以依赖于此前的迭代步骤中已经作出的选择,但不能依赖 于未来的选择。打个比方,贪心选择就像一个每次只计算一步棋的棋手,他总是选择当前能 获得最大利益的一步棋,而不考虑这步棋会不会在以后造成损失。显然,一步棋的好坏不能 只取决于当前利益,而是要着眼全局。在贪心策略下,以后即使认识到前面某一步棋不佳, 也是不允许悔棋的。可见,贪心算法具有“只看眼前利益”和“落子无悔”的两大特点。
当然,好的棋手是不会采用贪心策略来下棋的,他们会计算未来的很多步棋,然后选择 全局最优的着法。这说明贪心策略只能对某些问题(如上述最小支撑树问题)能产生全局最 优解,对另一些问题则不然。不过,贪心算法的优点是能够较快地找出解法,产生的结果经 常也是接近全局最优解的;而一心追求全局最优解则有可能导致无法在合理的时间内达到目 标,就像棋手如果指望算无遗策,那就要花费大量时间来计算着法,这几乎是不可能的。
最后顺便提一下,在前面的输油管道问题中,为了从油库 A 向加油站 E 供油,采用贪 心算法设计出的方案是将 A 经 B、C、G、H、F 来与 E 连通,这条管线的总长度为 145 千 米。而假如直接在 A 和 E 之间修一条管道的话只需要 80 千米!可见,如果待解决的问题是 修建从油库到每一个加油站的最短管道,前述两个算法是不合适的。事实上,存在另一个采 用贪心法设计的著名算法——Dijkstra 最短路径算法,可以很好地解决这个问题。
- 前言
- 第 1 章 计算与计算思维
- 1.1 什么是计算?
- 1.1.1 计算机与计算
- 1.1.2 计算机语言
- 1.1.3 算法
- 1.1.4 实现
- 1.2 什么是计算思维?
- 1.2.1 计算思维的基本原则
- 1.2.2 计算思维的具体例子
- 1.2.3 日常生活中的计算思维
- 1.2.4 计算思维对其他学科的影响
- 1.3 初识 Python
- 1.3.1 Python 简介
- 1.3.2 第一个程序
- 1.3.3 程序的执行方式
- 1.3.4 Python 语言的基本成分
- 1.4 程序排错
- 1.5 练习
- 第 2 章 用数据表示现实世界
- 2.1 数据和数据类型
- 2.1.1 数据是对现实的抽象
- 2.1.1 常量与变量
- 2.1.2 数据类型
- 2.1.3 Python 的动态类型*
- 2.2 数值类型
- 2.2.1 整数类型 int
- 2.2.2 长整数类型 long
- 2.2.3 浮点数类型 float
- 2.2.4 数学库模块 math
- 2.2.5 复数类型 complex*
- 2.3 字符串类型 str
- 2.3.1 字符串类型的字面值形式
- 2.3.2 字符串类型的操作
- 2.3.3 字符的机内表示
- 2.3.4 字符串类型与其他类型的转换
- 2.3.5 字符串库 string
- 2.4 布尔类型 bool
- 2.4.1 关系运算
- 2.4.2 逻辑运算
- 2.4.3 布尔代数运算定律*
- 2.4.4 Python 中真假的表示与计算*
- 2.5 列表和元组类型
- 2.5.1 列表类型 list
- 2.5.2 元组类型 tuple
- 2.6 数据的输入和输出
- 2.6.1 数据的输入
- 2.6.2 数据的输出
- 2.6.3 格式化输出
- 2.7 编程案例:查找问题
- 2.8 练习
- 第 3 章 数据处理的流程控制
- 3.1 顺序控制结构
- 3.2 分支控制结构
- 3.2.1 单分支结构
- 3.2.2 两路分支结构
- 3.2.3 多路分支结构
- 3.3 异常处理
- 3.3.1 传统的错误检测方法
- 3.3.2 传统错误检测方法的缺点
- 3.3.3 异常处理机制
- 3.4 循环控制结构
- 3.4.1 for 循环
- 3.4.2 while 循环
- 3.4.3 循环的非正常中断
- 3.4.4 嵌套循环
- 3.5 结构化程序设计
- 3.5.1 程序开发过程
- 3.5.2 结构化程序设计的基本内容
- 3.6 编程案例:如何求 n 个数据的最大值?
- 3.6.1 几种解题策略
- 3.6.2 经验总结
- 3.7 Python 布尔表达式用作控制结构*
- 3.8 练习
- 第 4 章 模块化编程
- 4.1 模块化编程基本概念
- 4.1.1 模块化设计概述
- 4.1.2 模块化编程
- 4.1.3 编程语言对模块化编程的支持
- 4.2 Python 语言中的函数
- 4.2.1 用函数减少重复代码 首先看一个简单的用字符画一棵树的程序:
- 4.2.2 用函数改善程序结构
- 4.2.3 用函数增强程序的通用性
- 4.2.4 小结:函数的定义与调用
- 4.2.5 变量的作用域
- 4.2.6 函数的返回值
- 4.3 自顶向下设计
- 4.3.1 顶层设计
- 4.3.2 第二层设计
- 4.3.3 第三层设计
- 4.3.4 第四层设计
- 4.3.5 自底向上实现与单元测试
- 4.3.6 开发过程小结
- 4.4 Python 模块*
- 4.4.1 模块的创建和使用
- 4.4.2 Python 程序架构
- 4.4.3 标准库模块
- 4.4.4 模块的有条件执行
- 4.5 练习
- 第 5 章 图形编程
- 5.1 概述
- 5.1.1 计算可视化
- 5.1.2 图形是复杂数据
- 5.1.3 用对象表示复杂数据
- 5.2 Tkinter 图形编程
- 5.2.1 导入模块及创建根窗口
- 5.2.2 创建画布
- 5.2.3 在画布上绘图
- 5.2.4 图形的事件处理
- 5.3 编程案例
- 5.3.1 统计图表
- 5.3.2 计算机动画
- 5.4 软件的层次化设计:一个案例
- 5.4.1 层次化体系结构
- 5.4.2 案例:图形库 graphics
- 5.4.3 graphics 与面向对象
- 5.5 练习
- 第 6 章 大量数据的表示和处理
- 6.1 概述
- 6.2 有序的数据集合体
- 6.2.1 字符串
- 6.2.2 列表
- 6.2.3 元组
- 6.3 无序的数据集合体
- 6.3.1 集合
- 6.3.2 字典
- 6.4 文件
- 6.4.1 文件的基本概念
- 6.4.2 文件操作
- 6.4.3 编程案例:文本文件分析
- 6.4.4 缓冲
- 6.4.5 二进制文件与随机存取*
- 6.5 几种高级数据结构*
- 6.5.1 链表
- 6.5.2 堆栈
- 6.5.3 队列
- 6.6 练习
- 第 7 章 面向对象思想与编程
- 7.1 数据与操作:两种观点
- 7.1.1 面向过程观点
- 7.1.2 面向对象观点
- 7.1.3 类是类型概念的发展
- 7.2 面向对象编程
- 7.2.1 类的定义
- 7.2.2 对象的创建
- 7.2.3 对象方法的调用
- 7.2.4 编程实例:模拟炮弹飞行
- 7.2.5 类与模块化
- 7.2.6 对象的集合体
- 7.3 超类与子类*
- 7.3.1 继承
- 7.3.2 覆写
- 7.3.3 多态性
- 7.4 面向对象设计*
- 7.5 练习
- 第 8 章 图形用户界面
- 8.1 图形用户界面概述
- 8.1.1 程序的用户界面
- 8.1.2 图形界面的组成
- 8.1.3 事件驱动
- 8.2 GUI 编程
- 8.2.1 UI 编程概述
- 8.2.2 初识 Tkinter
- 8.2.3 常见 GUI 构件的用法
- 8.2.4 布局
- 8.2.5 对话框*
- 8.3 Tkinter 事件驱动编程
- 8.3.1 事件和事件对象
- 8.3.2 事件处理
- 8.4 模型-视图设计方法
- 8.4.1 将 GUI 应用程序封装成对象
- 8.4.2 模型与视图
- 8.4.3 编程案例:汇率换算器
- 8.5 练习
- 第 9 章 模拟与并发
- 9.1 模拟
- 9.1.1 计算机建模
- 9.1.2 随机问题的建模与模拟
- 9.1.3 编程案例:乒乓球比赛模拟
- 9.2 原型法
- 9.3 并行计算*
- 9.3.1 串行、并发与并行
- 9.3.2 进程与线程
- 9.3.3 多线程编程的应用
- 9.3.4 Python 多线程编程
- 9.3.5 小结
- 9.4 练习
- 第 10 章 算法设计和分析
- 10.1 枚举法
- 10.2 递归
- 10.3 分治法
- 10.4 贪心法
- 10.5 算法分析
- 10.5.1 算法复杂度
- 10.5.2 算法分析实例
- 10.6 不可计算的问题
- 10.7 练习
- 第 11 章 计算+X
- 11.1 计算数学
- 11.2 生物信息学
- 11.3 计算物理学
- 11.4 计算化学
- 11.5 计算经济学
- 11.6 练习
- 附录
- 1 Python 异常处理参考
- 2 Tkinter 画布方法
- 3 Tkinter 编程参考
- 3.1 构件属性值的设置
- 3.2 构件的标准属性
- 3.3 各种构件的属性
- 3.4 对话框
- 3.5 事件
- 参考文献