2. python函数.md · python3教程-廖雪峰

# 函数基本上所有的高级语言都支持函数，Python 也不例外。Python 不但能非常灵活地定义函数，而且本身内置了很多有用的函数，可以直接调用。借助抽象，我们才能不关心底层的具体计算过程，而直接在更高的层次上思考问题。写计算机程序也是一样，函数就是最基本的一种代码抽象的方式 ## 调用函数要调用一个函数，需要知道函数的名称和参数调用函数的时候，如果传入的参数数量不对，会报 TypeError 的错误， Python 内置的常用函数还包括数据类型转换函数，比如 int() 函数可以把其他数据类型转换为整数： ```js >>> int('123') 123 >>> int(12.34) 12 >>> float('12.34') 12.34 >>> str(1.23) '1.23' >>> str(100) '100' >>> bool(1) True >>> bool('') False ``` 函数名其实就是指向一个函数对象的引用，完全可以把函数名赋给一个变量，相当于给这个函数起了一个 “别名”： ```js >>> a = abs # 变量a指向abs函数 >>> a(-1) # 所以也可以通过a调用abs函数 1 ``` ## 定义函数 ### 定义函数 ```js def my_abs(x): if x >= 0: return x else: return -x ``` 函数体内部的语句在执行时，一旦执行到 return 时，函数就执行完毕，并将结果返回。如果没有 return 语句，函数执行完毕后也会返回结果，只是结果为 None。return None 可以简写为 return。如果你已经把 my_abs() 的函数定义保存为 abstest.py 文件了，那么，可以在**该文件**的当前目录下启动 Python 解释器，用 from abstest import my_abs 来导入 my_abs() 函数， > 注意 abstest 是文件名（不含.py 扩展名） ```js >>> from abstest import my_abs >>> my_abs(-9) 9 ``` 如果想定义一个什么事也不做的空函数，可以用 pass 语句： ```js def nop(): pass ``` 实际上 pass 可以用来作为占位符，比如现在还没想好怎么写函数的代码，就可以先放一个 pass，让代码能运行起来 ### 参数检查调用函数时，如果参数个数不对，Python 解释器会自动检查出来，并抛出 TypeError，但是如果参数类型不对，Python 解释器无法帮我们检查。我们可以修改一下 my_abs 的定义，对参数类型做检查，只允许整数和浮点数类型的参数。数据类型检查可以用内置函数 isinstance() 实现： ```js def my_abs(x): if not isinstance(x, (int, float)): raise TypeError('bad operand type') if x >= 0: return x else: return -x ``` ### 返回多个值 ```js import math def move(x, y, step, angle=0): nx = x + step * math.cos(angle) ny = y - step * math.sin(angle) return nx, ny ``` 然后调用函数 ```python >>> x, y = move(100, 100, 60, math.pi / 6) >>> r = move(100, 100, 60, math.pi / 6) >>> print(r) (151.96152422706632, 70.0) ``` 原来返回值是一个 tuple！但是，在语法上，返回一个 tuple 可以省略括号，而多个变量可以同时接收一个 tuple，按位置赋给对应的值，所以，Python 的函数返回多值其实就是返回一个 tuple，但写起来更方便。 ## 函数的参数 Python 的函数定义非常简单，但灵活度却非常大。除了正常定义的必选参数外，还可以使用默认参数、可变参数和关键字参数 ### 默认参数一是必选参数在前，默认参数在后，否则 Python 的解释器会报错（思考一下为什么默认参数不能放在必选参数前面）；二是如何设置默认参数。当函数有多个参数时，把变化大的参数放前面，变化小的参数放后面。变化小的参数就可以作为默认参数。使用默认参数有什么好处？最大的好处是能降低调用函数的难度 > 定义默认参数要牢记一点：默认参数必须指向不变对象！因为函数在定义的时候，默认参数的值就被计算出来了，如果默认参数指向可变对象，每次调用的时候，默认参数的内容就改变了，不再是定义时的对象。比如 ```js def add_end(L=[]): L.append('END') return L ``` 当使用默认参数调用的时候， ```js >>> add_end() ['END'] ``` 但是再次调用的时候： ```js >>> add_end() ['END', 'END'] >>> add_end() ['END', 'END', 'END'] ``` 默认参数明明是 "[]"，但是函数每次都记住了上次添加'END'的list了要修改上面的例子，我们可以用 None 这个不变对象来实现 ```js def add_end(L=None): if L is None: L = [] L.append('END') return L ``` 我们在编写程序的时候，如果可以设计一个不变对象，就尽量设计成不变对象。因为不变对象一旦创建，对象内部的数据就不能修改，这样就减少了由于修改数据导致的错误。此外，由于对象不变，多任务环境下同时读取对象不需要加锁，同时读一点问题都没有 ### 可变参数顾名思义，可变参数就是传输的参数的个数是可变的。由于要输入的参数个数是不确定的，所以可以将参数作为一个list或者tuple传进来。 ```js def calc(numbers): sum = 0 for n in numbers: sum = sum + n * n return sum >>> calc([1, 2, 3]) 14 ``` 这样在调用的时候，需要将参数先组装成list或者tuple，如果利用可变参数，可以将调用方式简化为： ```js def calc(*numbers): sum = 0 for n in numbers: sum = sum + n * n return sum ``` 与定义一个list参数相比，仅仅在参数前面加了一个*号。在函数内部，参数numbers仍然被当作一个tuple 如果已经有一个list或者tuple，，要调用一个可变参数怎么半？可以在传入的时候，在list前面加一个*号， ```js >>> nums = [1, 2, 3] >>> calc(*nums) 14 ``` ### 关键字参数上面我们讲到了可变参数，它允许我们传入任意个参数，这些参数可以在函数调用的时候自动组装成一个tuple，适用于可能传入任意个数个参数的情况。有的时候，我们还希望参数的关键字也不固定，所以可以传入一个dict，然后在函数内部自动组装成一个dict ```js def person(name, age, **kw): print('name:', name, 'age:', age, 'other:', kw) ``` 我们可以传视频入任意个数的关键字 ```js >>> person('Adam', 45, gender='M', job='Engineer') name: Adam age: 45 other: {'gender': 'M', 'job': 'Engineer'} ``` 这样可以扩展函数的功能，比如说现在在做一个用户注册功能，除了用户名和年龄是必选项，其他的都是可选项，利用关键字来定义函数就可以满足这个要求。同样，我们也可以先组装成一个dict，然后把该dict转换成关键字传进去。 ```js >>> extra = {'city': 'Beijing', 'job': 'Engineer'} >>> person('Jack', 24, **extra) name: Jack age: 24 other: {'city': 'Beijing', 'job': 'Engineer'} ``` > **extra 表示把 extra 这个 dict 的所有 key-value 用关键字参数传入到函数的 **kw 参数，kw 将获得一个 dict，注意 kw 获得的 dict 是 extra 的一份拷贝，对 kw 的改动不会影响到函数外的 extra。 ### 命名关键字参数如果要限制关键字参数的名字，例如只接受city和job作为关键字参数， ```js def person(name, age, *, city, job): print(name, age, city, job) >>> person('Jack', 24, city='Beijing', job='Engineer') Jack 24 Beijing Engineer ``` *号后面的参数被视为命名关键字参数。如果函数定义中已经有了一个可变参数，后面跟着的命名关键字参数就不再需要一个特殊分隔符 * 了 ```js def person(name, age, *args, city, job): print(name, age, args, city, job) ``` 使用命名关键字参数，需要注意，必须得传入参数名，如果没有传入的话，调用将会报错。 ```js >>> person('Jack', 24, 'Beijing', 'Engineer') Traceback (most recent call last): File "<stdin>", line 1, in <module> TypeError: person() takes 2 positional arguments but 4 were given ``` 同样命名关键字参数可以有缺省值 ```js def person(name, age, *, city='Beijing', job): print(name, age, city, job) # 调用的时候可以不传入有默认值的 city参数 >>> person('Jack', 24, job='Engineer') Jack 24 Beijing Engineer ``` ### 参数的组合在Python中定义函数，可以用必选参数、默认参数、可变参数、关键字参数、命名关键字参数而且这5种参数可以组合使用，但是需要注意一定的顺序：必选参数、默认参数、可变参数、命名关键字参数、关键字参数比如 ```js def f1(a, b, c=0, *args, **kw): print('a =', a, 'b =', b, 'c =', c, 'args =', args, 'kw =', kw) def f2(a, b, c=0, *, d, **kw): print('a =', a, 'b =', b, 'c =', c, 'd =', d, 'kw =', kw) ``` 在函数调用的时候，Python 解释器自动按照参数位置和参数名把对应的参数传进去。如果通过一个 tuple 和 dict，你也可以调用上述函数： ```js >>> args = (1, 2, 3, 4) >>> kw = {'d': 99, 'x': '#'} >>> f1(*args, **kw) a = 1 b = 2 c = 3 args = (4,) kw = {'d': 99, 'x': '#'} >>> args = (1, 2, 3) >>> kw = {'d': 88, 'x': '#'} >>> f2(*args, **kw) a = 1 b = 2 c = 3 d = 88 kw = {'x': '#'} ``` 对于任意函数，都可以通过类似 func(*args, **kw) 的形式调用它，无论它的参数是如何定义的。 ### 小结 Python 的函数具有非常灵活的参数形态，既可以实现简单的调用，又可以传入非常复杂的参数。默认参数一定要用 **不可变对象**，如果是可变对象，程序运行时会有逻辑错误！要注意定义可变参数和关键字参数的语法： *args 是可变参数，args 接收的是一个 tuple； **kw 是关键字参数，kw 接收的是一个 dict。以及调用函数时如何传入可变参数和关键字参数的语法：可变参数既可以直接传入：func(1, 2, 3)，又可以先组装 list 或 tuple，再通过 *args 传入：func(*(1, 2, 3))；关键字参数既可以直接传入：func(a=1, b=2)，又可以先组装 dict，再通过 **kw 传入：func(**{'a': 1, 'b': 2})。使用 *args 和 **kw 是 Python 的习惯写法，当然也可以用其他参数名，但最好使用习惯用法。命名的关键字参数是为了限制调用者可以传入的参数名，同时可以提供默认值。定义命名的关键字参数在没有可变参数的情况下不要忘了写分隔符 *，否则定义的将是位置参数。 ## 递归函数如果一个函数在内部调用自身本身，这个函数就是递归函数。比如说阶乘，使用递归方式写出来就是 ```python def fact(n): if n == 1: return 1 return n * fact(n - 1) ``` 如果我们计算 fact(5)，可以根据函数定义看到计算过程如下： ===> fact(5) ===> 5 * fact(4) ===> 5 * (4 * fact(3)) ===> 5 * (4 * (3 * fact(2))) ===> 5 * (4 * (3 * (2 * fact(1)))) ===> 5 * (4 * (3 * (2 * 1))) ===> 5 * (4 * (3 * 2)) ===> 5 * (4 * 6) ===> 5 * 24 ===> 120 如果我们计算 fact(5)，可以根据函数定义看到计算过程如下： ```js ===> fact(5) ===> 5 * fact(4) ===> 5 * (4 * fact(3)) ===> 5 * (4 * (3 * fact(2))) ===> 5 * (4 * (3 * (2 * fact(1)))) ===> 5 * (4 * (3 * (2 * 1))) ===> 5 * (4 * (3 * 2)) ===> 5 * (4 * 6) ===> 5 * 24 ===> 120 ``` 递归函数的优点在于定义简单，逻辑清晰。理论上所有的递归函数都可以写成循环的方式，但是循环的方式不如递归清晰。但是使用递归函数需要注意栈溢出。如果递归调用次数过多，就会导致栈溢出。可以使用 **尾递归**来进行优化。也就是说，在函数返回的时候，调用自身本身，并且return语句不能包含表达式。这样，编译器会把尾递归做优化，不管调用多少次，都只占用一个栈帧比如说 `fact(n)` ```python def fact(n): return fact_iter(n, 1 ) def fact_iter(num , product): if num == 1: return product return fact_iter ( num -1 , num * product) ``` 可以看到，return fact_iter(num - 1, num * product) 仅返回递归函数本身，num - 1 和 num * product 在函数调用前就会被计算，不影响函数调用。 fact(5) 对应的 fact_iter(5, 1) 的调用如下： ```js ===> fact_iter(5, 1) ===> fact_iter(4, 5) ===> fact_iter(3, 20) ===> fact_iter(2, 60) ===> fact_iter(1, 120) ===> 120 ``` 尾递归调用时，如果做了优化，栈不会增长，因此，无论多少次调用也不会导致栈溢出。遗憾的是，大多数编程语言没有针对尾递归做优化，Python 解释器也没有做优化，所以，即使把上面的 fact(n) 函数改成尾递归方式，也会导致栈溢出。 # 函数式编程函数是 Python 内建支持的一种封装，我们通过把大段代码拆成函数，通过一层一层的函数调用，就可以把复杂任务分解成简单的任务，这种分解可以称之为**面向过程的程序设计**。函数就是面向过程的程序设计的基本单元。而函数式编程——Functional Programming，虽然也可以归结到面向过程的程序设计，但其思想更接近数学计算。函数式编程就是一种抽象程度很高的编程范式，纯粹的函数式编程语言编写的函数没有变量，因此，任意一个函数，只要输入是确定的，输出就是确定的，这种纯函数我们称之为没有副作用。而允许使用变量的程序设计语言，由于函数内部的变量状态不确定，同样的输入，可能得到不同的输出，因此，这种函数是有副作用的。函数式编程的一个**特点**就是，允许把函数本身作为参数传入另一个函数，还允许返回一个函数！ Python 对函数式编程提供部分支持。由于 Python 允许使用变量，因此，Python 不是纯函数式编程语言。 ## 高阶函数变量可以指向函数，而函数的参数能接收变量，所以一个函数就可以接收另一个函数作为参数，这种函数就称之为高阶函数。 ### 变量指向函数对于Python内置的函数 `abs()`，如果只写 `abs` ```js >>> abs <built-in function abs> ``` 我们可以把函数本身赋给变量 ```js >>> f = abs >>> f <built-in function abs> ``` 这样变量就指向了函数。这个时候，可以使用该变量来调用函数 ```js >>> f = abs >>> f(-10) 10 ``` 那么函数名其实就是指向函数的变量。所以说高阶函数指的就是一个函数可以接收另一个函数作为参数。 ```js def add(x, y, f): return f(x) + f(y) add(-5, 6, abs) ``` 把函数作为参数传入，这样的函数称为高阶函数，函数式编程就是指这种高度抽象的编程范式。 ### map reduce Python内建了 map()和reduce() map()函数接收两个参数，一个是函数，一个是Iterable，map将传入的函数依次作用到序列的每个元素中。并且把新的结果作为新的Iterable返回。比如我们有一个函数 f (x)=x2，要把这个函数作用在一个 list [1, 2, 3, 4, 5, 6, 7, 8, 9] 上，就可以用 map() 实现如下： ```js f(x) = x * x │ │ ┌───┬───┬───┬───┼───┬───┬───┬───┐ │ │ │ │ │ │ │ │ │ ▼ ▼ ▼ ▼ ▼ ▼ ▼ ▼ ▼ [ 1 2 3 4 5 6 7 8 9 ] │ │ │ │ │ │ │ │ │ │ │ │ │ │ │ │ │ │ ▼ ▼ ▼ ▼ ▼ ▼ ▼ ▼ ▼ [ 1 4 9 16 25 36 49 64 81 ] ``` 使用代码实现： ```js >>> def f(x): ... return x * x ... >>> r = map(f, [1, 2, 3, 4, 5, 6, 7, 8, 9]) >>> list(r) [1, 4, 9, 16, 25, 36, 49, 64, 81] ``` map() 传入的第一个参数是 f，即函数对象本身。由于结果 r 是一个 Iterator，Iterator 是惰性序列，因此通过 list() 函数让它把整个序列都计算出来并返回一个 list。同样，如果我们不使用 `map()`函数，使用循环也可以得到这样的计算结果，但是使用循环，就不能一眼看明白把 f (x) 作用在 list 的每一个元素并把结果生成一个新的 list map() 作为高阶函数，事实上它把运算规则抽象了我们甚至可以定义更复杂的函数，比如说将list所有数字都转换成字符串 ```python list(map(str,[1,2,3,4,5])) ``` 再看 reduce. reduce把一个函数作用在一个序列上，这个序列必须接收两个参数，它会把结果继续和序列的下一个元素做累积计算。 ```python reduce(f,[x1,x2,x3,x4])=f(f(f(x1,x2),x3),x4) ``` 首先是将f作用到x1和x2上，然后再把得到的值与x3一起带入f里面。比如说对一个序列求活，或者把序列变成整数 ```python from functools import reduce def f (x,y): return x*10 + y reduce(fn , [1,3,4,5]) ``` 我们将这个例子稍加改动就可以写出str转int的函数。对于一个str序列里面每一个元素，使用map将其转换成 int类型。然后再使用reduce将其归并到一起。 ```python from functools imprt reduce def char2num(s): digit = {'0': 0, '1': 1, '2': 2, '3': 3, '4': 4, '5': 5, '6': 6, '7': 7, '8': 8, '9': 9} return digit[s] def fn (x, y ): return x * 10 +y reduce(fn , map(char2num, "12345")) ``` 可以整理成一个函数，并且使用lambda函数进行简化 ```python from functools import reduce DIGITS = {'0': 0, '1': 1, '2': 2, '3': 3, '4': 4, '5': 5, '6': 6, '7': 7, '8': 8, '9': 9} def char2num (s): return DIGITS[s] def str2int(s): return reduce ( lambda x,y: x*10 + y , map (char2num , s)) ``` ### filter 与map()类似，filter()也接收一个函数和一个序列。 filter()把传入函数依次作用于每一个元素，然后根据返回值是True还是False来决定保留还是丢弃元素比如说我们可以先定义一个规则 ```python def is_odd(n): return n % 2 == 1 ``` 如果输入的n除以2 余数为1 的话，说明n为奇数。然后使用filter函数将奇数过滤出来 ```python list(filter(is_odd , [1,2,3,4,5,6])) # 结果为[1,3,5] ``` 也可以把一个序列的空字符串删除掉 ```Python # 因为需要把不为空的过滤出来，所以定义一个函数，如果字符不为空，则返回1 def not_empty(s): return s and s.strip() list(filter(not_empty , ['A',"","B",None])) ``` 我们知道，如果为空，则求他的bool值为0 我们可以使用filter来求素数计算素数的一个方法是埃氏筛法第一步，需要列出从2开始所有自然数，构成一个序列取序列中的第一个数2，它一定是素数，然后把2的倍数给筛选掉取新序列的第一个数3，然后把3的倍数筛掉。同理可推其他步骤我们可以构建一个从3开始的奇数序列 ```python def _odd_iter(): n = 1 while True: n = n + 2 yield n ``` 这是应该生成器，而且是一个无限序列然后定义一个筛选器 ```python # 不是n的倍数的值需要被筛选出来 def _not_divisible(n): return lambda x: x % n > 0 ``` 最后定义一个生成器，不断返回下一个素数 ```pythoh def prime(): yield 2 it = _odd_iter ()#初始序列 while True: n = next (it) # 返回序列中的第一个数 yield n it = filter (_not_divisible(n) , it) ``` 由于 primes() 也是一个无限序列，所以调用时需要设置一个退出循环的条件： ```js # 打印1000以内的素数: for n in primes(): if n < 1000: print(n) else: break ``` ### sorted 排序的核心是比较两个元素的大小。如果是数字，则可以直接进行比较，但是如果是字符串呢？直接比较数学上的大小是没有意义的，我们可以使用函数来自定义比较的过程。 sorted() 函数也是一个高阶函数，它还可以接收一个 key 函数来实现自定义的排序，例如按绝对值大小排序： ```Python sorted([36, 5, -12, 9, -21], key=abs) ``` 再比如，对于字符串排序，默认情况下，是按照ASCII大小比较的。也就是说，有于 'Z' < 'a'，所以大写字母Z会排在小写字符a的前面。但是我们更希望能忽略大小写 ```python sorted(['bob', 'about', 'Zoo', 'Credit'], key=str.lower) ``` ## 返回函数对于一个可变参数的求和 ```js def calc_sum(*args): ax = 0 for n in args: ax = ax + n return ax ``` 但是，如果不需要立刻求和，而是需要在后面的代码里面根据需要再计算？可以返回求和的函数，而不是求和的结果 ```python def lazy_sum(*args): def sum(): ax = 0 for n in args: ax = ax + n return ax return sum ``` 当我们调用 lazy_sum() 时，返回的并不是求和结果，而是求和函数： ```js >>> f = lazy_sum(1, 3, 5, 7, 9) >>> f <function lazy_sum.<locals>.sum at 0x101c6ed90> ``` 调用函数 f 时，才真正计算求和的结果： ```python f() 25 ``` 我们在函数 lazy_sum中又定义了一个sum函数，并且内部函数sum可以引用外部函数lazy_sum的参数和局部变量。同时，当lazy_sum返回函数sum的时候，相关参数和变量都是保存在返回的函数中的，这种程序结构叫做“闭包” 另外返回的函数并没有立刻执行，而是直到调用了 f() 才执行 ```python def count(): fs = [] for i in range(1, 4): def f(): return i*i fs.append(f) return fs f1, f2, f3 = count() ``` 在上面的函数中，每次循环都创建了一个新的函数。可能认为调用 f1()，f2() 和 f3() 结果应该是 1，4，9，但实际结果是： ```js >>> f1() 9 >>> f2() 9 >>> f3() 9 ``` 全部都是 9！原因就在于返回的函数引用了变量 i，但它并非立刻执行。等到 3 个函数都返回时，它们所引用的变量 i 已经变成了 3，因此最终结果为 9。 > 返回闭包时牢记一点：返回函数不要引用任何循环变量，或者后续会发生变化的变量。 > 也就是返回的函数的外层不能有循环变量另外，当我们调用lazy_sum()的时候，每次调用都会返回一个新的函数，这两个函数的调用结果互不影响。 ```js >>> f1 = lazy_sum(1, 3, 5, 7, 9) >>> f2 = lazy_sum(1, 3, 5, 7, 9) >>> f1==f2 False ``` ## 匿名函数 lambda 匿名函数有个限制，就是只能有一个表达式，不用写 return，返回值就是该表达式的结果用匿名函数有个好处，因为函数没有名字，不必担心函数名冲突。此外，匿名函数也是一个函数对象，也可以把匿名函数赋值给一个变量，再利用变量来调用该函数： ## 装饰器假设需要增强now函数的功能，比如说在函数调用前自动打印日志，这种在代码运行期间动态增加功能的方式称为 “装饰器” 本质上， decorator就是一个返回函数的高阶函数。 ```python def log(func): def wrapper(*args, **kw): print ('call %s():' % func.__name__) return func(*args , **kw) return wrapper ``` 函数其实就是一个对象，同时，函数对象有一个 `__name__`属性，可以拿到函数的名字 ```python now.__name__ 'now' ``` 观察上面的 log，因为它是一个 decorator，所以接受一个函数作为参数，并返回一个函数。那么如何调用呢？可以把decorator置于函数的定义处 ```python @log def now(): print('2015-03-25') ``` 调用now()函数的时候，不仅会运行函数本身，还会在函数前打日志 ```js >>> now() call now(): 2015-3-25 ``` 把 @log 放到 now() 函数的定义处，相当于执行了语句： ```js now = log(now) ``` 由于 log() 是一个 decorator，返回一个函数，所以，原来的 now() 函数仍然存在，只是现在同名的 now 变量指向了新的函数，于是调用 now() 将执行新函数，即在 log() 函数中返回的 wrapper() 函数。如果 decorator 本身需要传入参数，那就需要编写一个返回 decorator 的高阶函数，写出来会更复杂。比如，要自定义 log 的文本： ```python def log(text)： def decorator(func): def wrapper (*args , **kw): print('%s %s():' % (text , func.__name__)) return func(*args , **kw) return wrapper return decorator ``` 这个 3 层嵌套的 decorator 用法如下： ```js @log('execute') def now(): print('2015-3-25') ``` 执行结果如下： ```python >>> now() execute now(): 2015-3-25 ``` 和两层嵌套的 decorator 相比，3 层嵌套的效果是这样的： ```python >>> now = log('execute')(now) ``` 首先执行 `log('execute')`，返回的是 decorator函数，再调用返回的函数，参数是now函数，返回的是 wrapper 另外，还需要把原始函数的__name__等属性复制到 wrapper() 函数中，否则，有些依赖函数签名的代码执行就会出错。 Python 内置的 functools.wraps可以实现 `wrapper.__name__ = func.__name__`这样的功能。所以一个完整的decorator的写法是 ```Python import functools def log (func): @functools.wraps(func) def wrapper(*args, **kw): print ('call %s():' % func.__name__) return func(*args , **kw) return wrapper ``` 或者针对带参数的decorator ```python import functools def log (text): def decorator(func): @functools.wraps(func) def wrapper(*args , **kw): print ('%s %s():' % (text , func.__name__)) return func(*args , **kw) return wrapper return decorator ``` ## 偏函数当函数的参数个数太多，需要简化的时候，可以使用 `functools.partial`可以创建一个新的函数，这个新的函数可以固定住原函数的部分参数，从而在调用的时候更简单。这就是偏函数(partial function) 比如说 int()默认将字符串转成十进制整数，这里面base参数的值默认为10 但是假设我们需要大量转换成二进制字符，如果要每次都传入 int(x , base = 2)非常的麻烦，所以可以再定义一个 `int2` ```python import functools int2 = functools.partial(int , base = 2 ) ``` functools.partial 的作用就是，把一个函数的某些参数给固定住（也就是设置默认值），返回一个新的函数，调用这个新函数会更简单。 ## 柯里化最简单的柯里化 (currying) 指的是将原来接收 2 个参数的函数 f (x, y) 变成新的接收 1 个参数的函数 g (x) 的过程，其中新函数 g = f (y)。以普通的加法函数为例： ```python def add1(x, y): return x + y ``` 通过嵌套函数可以把函数 add1 转换成柯里化函数 add2。 ```python def add2(x): def add(y): return x + y return add ``` 仔细看看函数 add1 和 add2 的参数 - add1：参数是 x 和 y，输出 x + y - add2：参数是 x，输出 x + y - g = add2(2)：参数是 y，输出 2 + y 下面代码也证实了上述分析： ```python add1 add2 g = add2(2) g <function __main__.add1(x, y)> <function __main__.add2(x)> <function __main__.add2.<locals>.add(y)> ``` - add1：参数是 x 和 y，输出 x + y - add2：参数是 x，输出 x + y - g = add2（2）：参数是 y，输出 2 + y 比较「普通函数 add1」和「柯里化函数 add2」的调用，结果都一样。 ```python print( add1(2, 3) ) print( add2(2)(3) ) print( g(3) ) 5 5 5 ``` # 解析式解析式是将一个可迭代对象转换成另一个可迭代对象的工具。不严谨的说，容器类型数据(str,tuple,list,dict,set)都是可迭代对象。 - 第一个可迭代对象：可以是任意容器类型数据 - 第二个可迭代对象：需要看是什么类型的解析试 - 列表解析式：可迭代对象是list - 字典解析式：可迭代对象是dict - 集合解析式：可迭代对象是set 解析式就是为了把「带条件的 for 循环」简化成一行代码的。列表解析式整个语句用「中括号 []」框住，而字典和集合解析式整个语句中「大括号 {}」框住。想想 list, dict 和 set 用什么括号定义就明白了 ```python # list comprehension [值 for 元素 in 可迭代对象 if 条件] # dict comprehension {键值对 for 元素 in 可迭代对象 if 条件} # set comprehension {值 for 元素 in 可迭代对象 if 条件} ``` 根据 input-operation-output 这个过程总结： - input：任何「可迭代数据 A」 - operation：用 for 循环来遍历 A 中的每个元素，用 if 来筛选满足条件的元素 Agood - output：将 Agood 打包成「可迭代数据」，生成列表用 []，生成列表用 {} ## 列表解析式如何从一个含整数列表中把奇数挑出来？ ```python odds = [n * 2 for n in lst if n % 2 == 1] ``` ![UTOOLS1565690873417.png](http://yanxuan.nosdn.127.net/8cb51d3138cc33c794cea4f85a94e292.png) 你可以把「for 循环」到「解析式」的过程想像成一个「复制 - 粘贴」的过程： - 将「for 循环」的新列表复制到「解析式」里 - 将 append 里面的表达式 n * 2 复制到新列表里 - 复制循环语句 for n in lst 到新列表里，不要最后的冒号 - 复制条件语句 if n%2 == 1 到新列表里，不要最后的冒号在把上面具体的例子推广到一般的例子，从「for 循环」到「列表解析式」的过程如下： ![UTOOLS1565690946998.png](http://yanxuan.nosdn.127.net/6496ece04660bb237fdc2c1266d36566.png) 上面「for 循环」只有一层，如果两层怎么转换「列表解析式」？套用一维列表解析式的做法 ![UTOOLS1565691007928.png](http://yanxuan.nosdn.127.net/bf505132d2a62fd387944a74a856e4ab.png) 两点需要注意： - 该例没有「if 条件」条件，或者认为有，写成「if True」。如果有「if 条件」那么直接加在「内 for 循环」后面。 - 「外 for 循环」写在「内 for 循环」前面。 ## 其他解析式可以举一反三比如说字典解析式 ![UTOOLS1565691199948.png](http://yanxuan.nosdn.127.net/e8e36c66ab9d9809a6b46c286f52a361.png) ## 小结再回顾下三种解析式，我们发现其实它们都可以实现上节提到的 filter 和 map 函数的功能，用专业计算机的语言说，解析式可以看成是 filter 和 map 函数的语法糖 - 语法糖 (syntactic sugar)：指计算机语言中添加的某种语法，对语言的功能没有影响，但是让程序员更方便地使用。 - 语法盐 (syntactic salt)：指计算机语言中添加的某种语法，使得程序员更难写出坏的代码。 - 语法糖浆 (syntactic syrup)：指计算机语言中添加的某种语法，没能让编程更加方便。为什么说「列表解析式」是「map/filter」的语法糖，两者的类比图如下： ![UTOOLS1565691998196.png](http://yanxuan.nosdn.127.net/230e99c03ac0438fed4aa6fbaa172445.png) 两者的主要作用就是将原列表根据某些条件转换成新列表，再者 - 列表解析式用 if条件来做筛选得到item，然后再用f函数作用到item上 - map/filter：用filter函数做筛选，再用map函数作用在筛选的元素上。「列表解析式」是种更简洁的方式。用「在列表中先找出奇数再乘以 2」，如果用列表解析式来实现 ```python [n * 2 for n in lst if n % 2 == 1] ``` 如果使用 map/filter来实现 ```python list(map(lambda n: n*2 , filter (lambda n : n%2 == 1 , lst))) ``` ## 小例子用解析试将二维元组里面的每个元素提取出来并存储到一个列表中 ```python tup = ((1, 2, 3), (4, 5, 6), (7, 8, 9)) ``` 先遍历第一层元组，用 for t in tup，然后遍历第二层元组，用 for x in t，提取每个 x 并 " 放在 “列表中，用 [] ```python flattend = [x for t in tup for x in t] ``` ![UTOOLS1565692317359.png](http://yanxuan.nosdn.127.net/d5ab7ae2ac8119007f5ecb4ea7d142a4.png) 如果我们想把上面「二维元组」转换成「二维列表」呢？ ```python [[x for x in t ] for t in tup ] ``` ## 复杂例子用解析试把不规则的列表a打平 ```python a = [1, 2, [3, 4], [[5, 6], [7, 8]]] ``` 用解析式一步到位解决上面问题有点难，特别是列表 a 不规则，每个元素还可以是 n 层列表，因此我们需要递推函数 (recursive function)，即一个函数里面又调用自己。 ```python def f(x): if type(x) is list: return [ y for l in x for y in f(l)] else: return [x] a = [1, 2, [3, 4], [[5, 6], [7, 8]]] f(a) ``` 把整个列表遍历一遍，有四个元素， 1, 2, [3,4]和[[5,6],[7,8]] 当x是元素的时候（不是list），返回[x] - f(1)的返回值为[1] - f(2)的返回值为[2] 当x是列表的时候，会执行 `[y for l in x for y in f(l)]` 当 `x=[3,4]` - `for l in x`：指的是x里面每个元素l，那么l遍历3和4 - `for y in f(l)`：指的是f(l)里面每个元素y - 当l= 3 ，由于是一个元素，所以 `f(l)=[3]`，y遍历3 - 当l=4，由于是一个元素，那么f(l) = [4]，y遍历4 整个 f ([3 ,4]) 的返回值是 [3 ,4]。同理，当 x = [[5, 6], [7, 8]] 时，f (x) 的返回值是 [5, 6, 7, 8]。把这所有的 y 再合成一个列表不就是 ```python [1, 2, 3, 4, 5, 6, 7, 8] ``` 再写成匿名函数 ```python a = [1, 2, [3, 4], [[5, 6], [7, 8]]] f = lambda x: [y for l in x for y in f(l)] if type(y) is list else [x] ``` ![UTOOLS1565694208848.png](http://yanxuan.nosdn.127.net/10191705c204d570c27603f947343fa7.png) # 总结优雅清晰是 python 的核心价值观，高阶函数和解析式都符合这个价值观。函数包括正规函数 (用 def) 和匿名函数 (用 lambda)，函数的参数形态也多种多样，有位置参数、默认参数、可变参数、关键字参数、命名关键字参数。匿名函数主要用在高阶函数中，高阶函数的参数可以是函数 (Python 里面内置 map/filter/reduce 函数)，返回值也可以是参数 (闭包、偏函数、柯里化函数)。解析式并没有解决新的问题，只是以一种更加简洁，可读性更高的方式解决老的问题。解析式可以把「带 if 条件的 for 循环」用一行程序表达出来，也可以实现 map 加 filter 的功能。