# 练习 29:`diff`和`patch`
> 原文:[Exercise 29: diff and patch](https://learncodethehardway.org/more-python-book/ex29.html)
> 译者:[飞龙](https://github.com/wizardforcel)
> 协议:[CC BY-NC-SA 4.0](http://creativecommons.org/licenses/by-nc-sa/4.0/)
> 自豪地采用[谷歌翻译](https://translate.google.cn/)
为了完成第四部分,你将简单把你所学习的完整的 TDD 流程,应用于你可能不熟悉的、更相关的项目。请参阅练习 28 来确认你了解该流程,并确保你严格遵循它。如果必须的话,创建一个检查列表。
> 警告
> 当你实际工作时,这个严格的流程完全没有用。目前,你正在研究该流程,并将其内在化,以便你可以在现实世界中使用它。这就是为什么我让你严格遵循它。这只是练习,所以当你做真正的工作时,不要成为一个狂热者。这本书的目的是,教你一套完成工作的策略,而不是教你一个可以传播给大众的宗教仪式。
## 挑战练习
`diff`命令接受两个文件并产生第三个文件(或输出),它包含第一个文件与第二个文件相比,修改的东西。它是`git`和其它版本控制工具的基础。在 Python 中实现`diff`是相当简单,因为有一个库可以为你做这件事,所以你不需要处理算法(这可能非常复杂)。
`patch `工具是`diff`工具的伙伴,因为它需要一个差异文件,并将其应用到另一个文件,来产生第三个文件。这可以让你选取在两个文件中的更改,运行`diff`来仅仅生成差异,然后将该`.diff`文件发送给某人。那个人可以使用他们的原始文件副本和`.diff`,使用`patch`来重建你的更改。
以下是一个工作流程示例,来演示`diff`和`patch`的工作原理。我有两个文件`A.txt`和`B.txt`。`A.txt文件包含一些简单的文字,然后我复制它,并创建`B.txt`,带有一些修改:
```
$ diff A.txt B.txt > AB.diff
$ cat AB.diff
2,4c2,4
< her fleece was white a mud
< and every where that marry
< her lamb would chew cud
---
> her fleece was white a snow
> and every where that marry went
> her lamb was sure to go
```
这产生了文件`AB.diff`,它拥有`A.txt`与`B.txt`相比的变化,你可以看到这是在修复我打破的押韵。一旦你有了`AB.diff`,你可以使用补丁应用更改:
```
$ patch A.txt AB.diff
$ diff A.txt B.txt
```
最后的命令应该不显示认识输出,因为之前的`patch`命令使`A.txt`与`B.txt`具有相同的内容。
这两个东西的实现,应该从`diff`命令开始,因为使用 Python 来作弊,你有完全实现的`diff`。你可以在`difflib`文档的末尾找到它,但尝试实现你的版本,并看看与之相比怎么样。
这个练习的真正要点就是`patch`工具,Python 没有为你实现它。你将要阅读`difflib`中的`SequenceMatcher`类,并特别查看`SequenceMatch.get_opcodes`函数。这是你`patch`工作的唯一线索,但这是一个非常好的线索。
## 研究性学习
你能把这种`diff`和`patch`的组合做到什么程度?你可以将它们组合成一个工具吗?你可以让他们像微型的`git`那样工作吗?
## 深入学习
找到尽可能多的差异比较算法。另一件需要研究的事情是`git`的工作方式。
- 笨办法学 Python · 续 中文版
- 引言
- 第一部分:预备知识
- 练习 0:起步
- 练习 1:流程
- 练习 2:创造力
- 练习 3:质量
- 第二部分:简单的黑魔法
- 练习 4:处理命令行参数
- 练习 5:cat
- 练习 6:find
- 练习 7:grep
- 练习 8:cut
- 练习 9:sed
- 练习 10:sort
- 练习 11:uniq
- 练习 12:复习
- 第三部分:数据结构
- 练习 13:单链表
- 练习 14:双链表
- 练习 15:栈和队列
- 练习 16:冒泡、快速和归并排序
- 练习 17:字典
- 练习 18:性能测量
- 练习 19:改善性能
- 练习 20:二叉搜索树
- 练习 21:二分搜索
- 练习 22:后缀数组
- 练习 23:三叉搜索树
- 练习 24:URL 快速路由
- 第四部分:进阶项目
- 练习 25:xargs
- 练习 26:hexdump
- 练习 27:tr
- 练习 28:sh
- 练习 29:diff和patch
- 第五部分:文本解析
- 练习 30:有限状态机
- 练习 31:正则表达式
- 练习 32:扫描器
- 练习 33:解析器
- 练习 34:分析器
- 练习 35:解释器
- 练习 36:简单的计算器
- 练习 37:小型 BASIC
- 第六部分:SQL 和对象关系映射
- 练习 38:SQL 简介
- 练习 39:SQL 创建
- 练习 40:SQL 读取
- 练习 41:SQL 更新
- 练习 42:SQL 删除
- 练习 43:SQL 管理
- 练习 44:使用 Python 的数据库 API
- 练习 45:创建 ORM
- 第七部分:大作业
- 练习 46:blog
- 练习 47:bc
- 练习 48:ed
- 练习 49:sed
- 练习 50:vi
- 练习 51:lessweb
- 练习 52:moreweb