高阶函数英文叫Higher-order function。什么是高阶函数?我们以实际代码为例子,一步一步深入概念。
### 变量可以指向函数
以Python内置的求绝对值的函数`abs()`为例,调用该函数用以下代码:
~~~
~~~
>>> abs(-10)
10
~~~
~~~
但是,如果只写`abs`呢?
~~~
~~~
>>> abs
<built-in function abs>
~~~
~~~
可见,`abs(-10)`是函数调用,而`abs`是函数本身。
要获得函数调用结果,我们可以把结果赋值给变量:
~~~
~~~
>>> x = abs(-10)
>>> x
10
~~~
~~~
但是,如果把函数本身赋值给变量呢?
~~~
~~~
>>> f = abs
>>> f
<built-in function abs>
~~~
~~~
结论:函数本身也可以赋值给变量,即:变量可以指向函数。
如果一个变量指向了一个函数,那么,可否通过该变量来调用这个函数?用代码验证一下:
~~~
~~~
>>> f = abs
>>> f(-10)
10
~~~
~~~
成功!说明变量`f`现在已经指向了`abs`函数本身。直接调用`abs()`函数和调用变量`f()`完全相同。
### 函数名也是变量
那么函数名是什么呢?函数名其实就是指向函数的变量!对于`abs()`这个函数,完全可以把函数名`abs`看成变量,它指向一个可以计算绝对值的函数!
如果把`abs`指向其他对象,会有什么情况发生?
~~~
~~~
>>> abs = 10
>>> abs(-10)
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
TypeError: 'int' object is not callable
~~~
~~~
把`abs`指向`10`后,就无法通过`abs(-10)`调用该函数了!因为`abs`这个变量已经不指向求绝对值函数而是指向一个整数`10`!
当然实际代码绝对不能这么写,这里是为了说明函数名也是变量。要恢复`abs`函数,请重启Python交互环境。
注:由于`abs`函数实际上是定义在`__builtin__`模块中的,所以要让修改`abs`变量的指向在其它模块也生效,要用`__builtin__.abs = 10`。
### 传入函数
既然变量可以指向函数,函数的参数能接收变量,那么一个函数就可以接收另一个函数作为参数,这种函数就称之为高阶函数。
一个最简单的高阶函数:
~~~
~~~
def add(x, y, f):
return f(x) + f(y)
~~~
~~~
当我们调用`add(-5, 6, abs)`时,参数`x`,`y`和`f`分别接收`-5`,`6`和`abs`,根据函数定义,我们可以推导计算过程为:
~~~
~~~
x = -5
y = 6
f = abs
f(x) + f(y) ==> abs(-5) + abs(6) ==> 11
return 11
~~~
~~~
用代码验证一下:
~~~
~~~
>>> add(-5, 6, abs)
11
~~~
~~~
编写高阶函数,就是让函数的参数能够接收别的函数。
### 小结
把函数作为参数传入,这样的函数称为高阶函数,函数式编程就是指这种高度抽象的编程范式。
Python内建了`map()`和`reduce()`函数。
如果你读过Google的那篇大名鼎鼎的论文“[MapReduce: Simplified Data Processing on Large Clusters](http://research.google.com/archive/mapreduce.html)”,你就能大概明白map/reduce的概念。
我们先看map。`map()`函数接收两个参数,一个是函数,一个是`Iterable`,`map`将传入的函数依次作用到序列的每个元素,并把结果作为新的`Iterator`返回。
举例说明,比如我们有一个函数f(x)=x2,要把这个函数作用在一个list `[1, 2, 3, 4, 5, 6, 7, 8, 9]`上,就可以用`map()`实现如下:
![map](https://box.kancloud.cn/2016-01-15_56988a24e36ff.png)
现在,我们用Python代码实现:
~~~
~~~
>>> def f(x):
... return x * x
...
>>> r = map(f, [1, 2, 3, 4, 5, 6, 7, 8, 9])
>>> list(r)
[1, 4, 9, 16, 25, 36, 49, 64, 81]
~~~
~~~
`map()`传入的第一个参数是`f`,即函数对象本身。由于结果`r`是一个`Iterator`,`Iterator`是惰性序列,因此通过`list()`函数让它把整个序列都计算出来并返回一个list。
你可能会想,不需要`map()`函数,写一个循环,也可以计算出结果:
~~~
~~~
L = []
for n in [1, 2, 3, 4, 5, 6, 7, 8, 9]:
L.append(f(n))
print(L)
~~~
~~~
的确可以,但是,从上面的循环代码,能一眼看明白“把f(x)作用在list的每一个元素并把结果生成一个新的list”吗?
所以,`map()`作为高阶函数,事实上它把运算规则抽象了,因此,我们不但可以计算简单的f(x)=x2,还可以计算任意复杂的函数,比如,把这个list所有数字转为字符串:
~~~
~~~
>>> list(map(str, [1, 2, 3, 4, 5, 6, 7, 8, 9]))
['1', '2', '3', '4', '5', '6', '7', '8', '9']
~~~
~~~
只需要一行代码。
再看`reduce`的用法。`reduce`把一个函数作用在一个序列`[x1, x2, x3, ...]`上,这个函数必须接收两个参数,`reduce`把结果继续和序列的下一个元素做累积计算,其效果就是:
~~~
~~~
reduce(f, [x1, x2, x3, x4]) = f(f(f(x1, x2), x3), x4)
~~~
~~~
比方说对一个序列求和,就可以用`reduce`实现:
~~~
~~~
>>> from functools import reduce
>>> def add(x, y):
... return x + y
...
>>> reduce(add, [1, 3, 5, 7, 9])
25
~~~
~~~
当然求和运算可以直接用Python内建函数`sum()`,没必要动用`reduce`。
但是如果要把序列`[1, 3, 5, 7, 9]`变换成整数`13579`,`reduce`就可以派上用场:
~~~
~~~
>>> from functools import reduce
>>> def fn(x, y):
... return x * 10 + y
...
>>> reduce(fn, [1, 3, 5, 7, 9])
13579
~~~
~~~
这个例子本身没多大用处,但是,如果考虑到字符串`str`也是一个序列,对上面的例子稍加改动,配合`map()`,我们就可以写出把`str`转换为`int`的函数:
~~~
~~~
>>> from functools import reduce
>>> def fn(x, y):
... return x * 10 + y
...
>>> def char2num(s):
... return {'0': 0, '1': 1, '2': 2, '3': 3, '4': 4, '5': 5, '6': 6, '7': 7, '8': 8, '9': 9}[s]
...
>>> reduce(fn, map(char2num, '13579'))
13579
~~~
~~~
整理成一个`str2int`的函数就是:
~~~
~~~
from functools import reduce
def str2int(s):
def fn(x, y):
return x * 10 + y
def char2num(s):
return {'0': 0, '1': 1, '2': 2, '3': 3, '4': 4, '5': 5, '6': 6, '7': 7, '8': 8, '9': 9}[s]
return reduce(fn, map(char2num, s))
~~~
~~~
还可以用lambda函数进一步简化成:
~~~
~~~
from functools import reduce
def char2num(s):
return {'0': 0, '1': 1, '2': 2, '3': 3, '4': 4, '5': 5, '6': 6, '7': 7, '8': 8, '9': 9}[s]
def str2int(s):
return reduce(lambda x, y: x * 10 + y, map(char2num, s))
~~~
~~~
也就是说,假设Python没有提供`int()`函数,你完全可以自己写一个把字符串转化为整数的函数,而且只需要几行代码!
lambda函数的用法在后面介绍。
### 练习
利用`map()`函数,把用户输入的不规范的英文名字,变为首字母大写,其他小写的规范名字。输入:`['adam', 'LISA', 'barT']`,输出:`['Adam', 'Lisa', 'Bart']`:
### 参考代码
[do_map.py](https://github.com/michaelliao/learn-python3/blob/master/samples/functional/do_map.py)
[do_reduce.py](https://github.com/michaelliao/learn-python3/blob/master/samples/functional/do_reduce.py)
Python内建的`filter()`函数用于过滤序列。
和`map()`类似,`filter()`也接收一个函数和一个序列。和`map()`不同的时,`filter()`把传入的函数依次作用于每个元素,然后根据返回值是`True`还是`False`决定保留还是丢弃该元素。
例如,在一个list中,删掉偶数,只保留奇数,可以这么写:
~~~
~~~
def is_odd(n):
return n % 2 == 1
list(filter(is_odd, [1, 2, 4, 5, 6, 9, 10, 15]))
# 结果: [1, 5, 9, 15]
~~~
~~~
把一个序列中的空字符串删掉,可以这么写:
~~~
~~~
def not_empty(s):
return s and s.strip()
list(filter(not_empty, ['A', '', 'B', None, 'C', ' ']))
# 结果: ['A', 'B', 'C']
~~~
~~~
可见用`filter()`这个高阶函数,关键在于正确实现一个“筛选”函数。
注意到`filter()`函数返回的是一个`Iterator`,也就是一个惰性序列,所以要强迫`filter()`完成计算结果,需要用`list()`函数获得所有结果并返回list。
### 用filter求素数
计算[素数](http://baike.baidu.com/view/10626.htm)的一个方法是[埃氏筛法](http://baike.baidu.com/view/3784258.htm),它的算法理解起来非常简单:
首先,列出从`2`开始的所有自然数,构造一个序列:
2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, ...
取序列的第一个数`2`,它一定是素数,然后用`2`把序列的`2`的倍数筛掉:
3, ~~4~~, 5, ~~6~~, 7, ~~8~~, 9, ~~10~~, 11, ~~12~~, 13, ~~14~~, 15, ~~16~~, 17, ~~18~~, 19, ~~20~~, ...
取新序列的第一个数`3`,它一定是素数,然后用`3`把序列的`3`的倍数筛掉:
5, ~~6~~, 7, ~~8~~, ~~9~~, ~~10~~, 11, ~~12~~, 13, ~~14~~, ~~15~~, ~~16~~, 17, ~~18~~, 19, ~~20~~, ...
取新序列的第一个数`5`,然后用`5`把序列的`5`的倍数筛掉:
7, ~~8~~, ~~9~~, ~~10~~, 11, ~~12~~, 13, ~~14~~, ~~15~~, ~~16~~, 17, ~~18~~, 19, ~~20~~, ...
不断筛下去,就可以得到所有的素数。
用Python来实现这个算法,可以先构造一个从`3`开始的奇数序列:
~~~
~~~
def _odd_iter():
n = 1
while True:
n = n + 2
yield n
~~~
~~~
注意这是一个生成器,并且是一个无限序列。
然后定义一个筛选函数:
~~~
~~~
def _not_divisible(n):
return lambda x: x % n > 0
~~~
~~~
最后,定义一个生成器,不断返回下一个素数:
~~~
~~~
def primes():
yield 2
it = _odd_iter() # 初始序列
while True:
n = next(it) # 返回序列的第一个数
yield n
it = filter(_not_divisible(n), it) # 构造新序列
~~~
~~~
这个生成器先返回第一个素数`2`,然后,利用`filter()`不断产生筛选后的新的序列。
由于`primes()`也是一个无限序列,所以调用时需要设置一个退出循环的条件:
~~~
~~~
# 打印1000以内的素数:
for n in primes():
if n < 1000:
print(n)
else:
break
~~~
~~~
注意到`Iterator`是惰性计算的序列,所以我们可以用Python表示“全体自然数”,“全体素数”这样的序列,而代码非常简洁。
### 小结
`filter()`的作用是从一个序列中筛出符合条件的元素。由于`filter()`使用了惰性计算,所以只有在取`filter()`结果的时候,才会真正筛选并每次返回下一个筛出的元素。
### 参考源码
[do_filter.py](https://github.com/michaelliao/learn-python3/blob/master/samples/functional/do_filter.py)
[prime_numbers.py](https://github.com/michaelliao/learn-python3/blob/master/samples/functional/prime_numbers.py)
### 排序算法
排序也是在程序中经常用到的算法。无论使用冒泡排序还是快速排序,排序的核心是比较两个元素的大小。如果是数字,我们可以直接比较,但如果是字符串或者两个dict呢?直接比较数学上的大小是没有意义的,因此,比较的过程必须通过函数抽象出来。通常规定,对于两个元素`x`和`y`,如果认为`x y`,则返回`1`,这样,排序算法就不用关心具体的比较过程,而是根据比较结果直接排序。
Python内置的`sorted()`函数就可以对list进行排序:
~~~
~~~
>>> sorted([36, 5, -12, 9, -21])
[-21, -12, 5, 9, 36]
~~~
~~~
此外,`sorted()`函数也是一个高阶函数,它还可以接收一个`key`函数来实现自定义的排序,例如按绝对值大小排序:
~~~
~~~
>>> sorted([36, 5, -12, 9, -21], key=abs)
[5, 9, -12, -21, 36]
~~~
~~~
key指定的函数将作用于list的每一个元素上,并根据key函数返回的结果进行排序。对比原始的list和经过`key=abs`处理过的list:
~~~
~~~
list = [36, 5, -12, 9, -21]
keys = [36, 5, 12, 9, 21]
~~~
~~~
然后`sorted()`函数按照keys进行排序,并按照对应关系返回list相应的元素:
~~~
~~~
keys排序结果 => [5, 9, 12, 21, 36]
| | | | |
最终结果 => [5, 9, -12, -21, 36]
~~~
~~~
我们再看一个字符串排序的例子:
~~~
~~~
>>> sorted(['bob', 'about', 'Zoo', 'Credit'])
['Credit', 'Zoo', 'about', 'bob']
~~~
~~~
默认情况下,对字符串排序,是按照ASCII的大小比较的,由于`'Z' < 'a'`,结果,大写字母`Z`会排在小写字母`a`的前面。
现在,我们提出排序应该忽略大小写,按照字母序排序。要实现这个算法,不必对现有代码大加改动,只要我们能用一个key函数把字符串映射为忽略大小写排序即可。忽略大小写来比较两个字符串,实际上就是先把字符串都变成大写(或者都变成小写),再比较。
这样,我们给`sorted`传入key函数,即可实现忽略大小写的排序:
~~~
~~~
>>> sorted(['bob', 'about', 'Zoo', 'Credit'], key=str.lower)
['about', 'bob', 'Credit', 'Zoo']
~~~
~~~
要进行反向排序,不必改动key函数,可以传入第三个参数`reverse=True`:
~~~
~~~
>>> sorted(['bob', 'about', 'Zoo', 'Credit'], key=str.lower, reverse=True)
['Zoo', 'Credit', 'bob', 'about']
~~~
~~~
从上述例子可以看出,高阶函数的抽象能力是非常强大的,而且,核心代码可以保持得非常简洁。
### 小结
`sorted()`也是一个高阶函数。用`sorted()`排序的关键在于实现一个映射函数。
### 练习
假设我们用一组tuple表示学生名字和成绩:
~~~
~~~
L = [('Bob', 75), ('Adam', 92), ('Bart', 66), ('Lisa', 88)]
~~~
~~~
请用`sorted()`对上述列表分别按名字排序:
~~~
~~~
# -*- coding: utf-8 -*-
L = [('Bob', 75), ('Adam', 92), ('Bart', 66), ('Lisa', 88)]
def by_name(t):
L2 = sorted(L, key=by_name)
print(L2)
Run
再按成绩从高到低排序:
# -*- coding: utf-8 -*-
L = [('Bob', 75), ('Adam', 92), ('Bart', 66), ('Lisa', 88)]
print(L2)
~~~
~~~
Run
### 参考源码
[do_sorted.py](https://github.com/michaelliao/learn-python3/blob/master/samples/functional/do_sorted.py)
- 关于
- Python简介
- 安装Python
- Python解释器
- 第一个Python程序
- 使用文本编辑器
- Python代码运行助手
- 输入和输出
- Python基础
- 数据类型和变量
- 字符串和编码
- 使用list和tuple
- 条件判断
- 循环
- 使用dict和set
- 函数
- 调用函数
- 定义函数
- 函数的参数
- 递归函数
- 高级特性
- 切片
- 迭代
- 列表生成式
- 生成器
- 迭代器
- 函数式编程
- 高阶函数
- 返回函数
- 匿名函数
- 装饰器
- 偏函数
- 模块
- 使用模块
- 安装第三方模块
- 面向对象编程
- 类和实例
- 访问限制
- 继承和多态
- 获取对象信息
- 实例属性和类属性
- 面向对象高级编程
- 使用slots
- 使用@property
- 多重继承
- 定制类
- 使用枚举类
- 使用元类
- 错误、调试和测试
- 错误处理
- 调试
- 单元测试
- 文档测试
- IO编程
- 文件读写
- StringIO和BytesIO
- 操作文件和目录
- 序列化
- 进程和线程
- 多进程
- 多线程
- ThreadLocal
- 进程 vs. 线程
- 分布式进程
- 正则表达式
- 常用内建模块
- datetime
- collections
- base64
- struct
- hashlib
- itertools
- XML
- HTMLParser
- urllib
- 常用第三方模块
- PIL
- virtualenv
- 图形界面
- 网络编程
- TCP/IP简介
- TCP编程
- UDP编程
- 电子邮件
- SMTP发送邮件
- POP3收取邮件
- 访问数据库
- 使用SQLite
- 使用MySQL
- 使用SQLAlchemy
- Web开发
- HTTP协议简介
- HTML简介
- WSGI接口
- 使用Web框架
- 使用模板
- 异步IO
- 协程
- asyncio
- aiohttp
- 实战
- Day 1 - 搭建开发环境
- Day 2 - 编写Web App骨架
- Day 3 - 编写ORM
- Day 4 - 编写Model
- Day 5 - 编写Web框架
- Day 6 - 编写配置文件
- Day 7 - 编写MVC
- Day 8 - 构建前端
- Day 9 - 编写API
- Day 10 - 用户注册和登录
- Day 11 - 编写日志创建页
- Day 12 - 编写日志列表页
- Day 13 - 提升开发效率
- Day 14 - 完成Web App
- Day 15 - 部署Web App
- Day 16 - 编写移动App
- FAQ
- 期末总结
- CoverPage