[TOC]
## 排序算法
### 介绍
排序也是在程序中经常用到的算法。无论使用冒泡排序还是快速排序,排序的核心是比较两个元素的大小。如果是数字,我们可以直接比较,但如果是字符串或者两个`dict`呢?直接比较数学上的大小是没有意义的,因此,比较的过程必须通过函数抽象出来。
### 使用
Python内置的`sorted()`函数就可以对`list`进行排序:
~~~
>>> sorted([36, 5, -12, 9, -21])
[-21, -12, 5, 9, 36]
~~~
此外,`sorted()`函数也是一个高阶函数,它还可以接收一个`key`函数来实现自定义的排序,例如按绝对值大小排序:
~~~
>>> sorted([36, 5, -12, 9, -21], key=abs)
[5, 9, -12, -21, 36]
~~~
`key`指定的函数将作用于`list`的每一个元素上,并根据`key`函数返回的结果进行排序。对比原始的`list`和经过`key=abs`处理过的`list`:
~~~
list = [36, 5, -12, 9, -21]
keys = [36, 5, 12, 9, 21]
~~~
然后`sorted()`函数按照`keys`进行排序,并按照对应关系返回`list`相应的元素:
| | | |
| | | |
|keys排序结果| =>|` [5, 9, 12, 21, 36]`|
|最终结果 | => |`[5, 9, -12, -21, 36]`|
我们再看一个字符串排序的例子:
~~~
>>> sorted(['bob', 'about', 'Zoo', 'Credit'])
['Credit', 'Zoo', 'about', 'bob']
~~~
默认情况下,对字符串排序,是按照ASCII的大小比较的,由于`'Z' < 'a'`,结果,大写字母`Z`会排在小写字母`a`的前面。
现在,我们提出排序应该忽略大小写,按照字母序排序。要实现这个算法,不必对现有代码大加改动,只要我们能用一个`key`函数把字符串映射为忽略大小写排序即可。忽略大小写来比较两个字符串,实际上就是先把字符串都变成大写(或者都变成小写),再比较。
这样,我们给`sorted`传入`key`函数,即可实现忽略大小写的排序:
~~~
>>> sorted(['bob', 'about', 'Zoo', 'Credit'], key=str.lower)
['about', 'bob', 'Credit', 'Zoo']
~~~
要进行反向排序,不必改动`key`函数,可以传入第三个参数`reverse=True`:
~~~
>>> sorted(['bob', 'about', 'Zoo', 'Credit'], key=str.lower, reverse=True)
['Zoo', 'Credit', 'bob', 'about']
~~~
从上述例子可以看出,高阶函数的抽象能力是非常强大的,而且,核心代码可以保持得非常简洁。
### 小结
`sorted()`也是一个高阶函数。用`sorted()`排序的关键在于实现一个映射函数。
### 练习
假设我们用一组`tuple`表示学生名字和成绩:
`L = [('Bob', 75), ('Adam', 92), ('Bart', 66), ('Lisa', 88)]`
请用`sorted()`对上述列表分别按名字排序:
~~~
# -*- coding: utf-8 -*-
L = [('Bob', 75), ('Adam', 92), ('Bart', 66), ('Lisa', 88)]
def by_name(t):
pass
L2 = sorted(L, key=by_name)
print(L2)
~~~
#### 参考源码
~~~
# -*- coding: utf-8 -*-
L = [('Bob', 75), ('Adam', 92), ('Bart', 66), ('Lisa', 88)]
def by_name(t):
return t[0][0].lower()
L2 = sorted(L, key=by_name)
print(L2)
~~~
>[info]制书作者提示:str.lower 是打印地址,str.lower() 是打印结果,比如:
t = 'TEST'
print(t.lower)
会输出如下结果:
<built-in method lower of str object at 0x000002ADF615EF48>
而通过 str.lower() 则会输出如下:
test
### 练习 2:
再按成绩从高到低排序:
~~~
# -*- coding: utf-8 -*-
L = [('Bob', 75), ('Adam', 92), ('Bart', 66), ('Lisa', 88)]
def by_score(t):
pass
L2 = ???
print(L2)
~~~
#### 参考源码
~~~
# -*- coding: utf-8 -*-
L = [('Bob', 75), ('Adam', 92), ('Bart', 66), ('Lisa', 88)]
def by_name(t):
return t[0][0].lower()
def by_score(t):
return t[1]
L2 = sorted(L, key=by_name)
L2 = sorted(L2, key=by_score)
print(L2)
~~~
- Python教程
- Python简介
- 安装Python
- Python解释器
- 第一个 Python 程序
- 使用文本编辑器
- Python代码运行助手
- 输入和输出
- 源码
- learning.py
- Python基础
- 数据类型和变量
- 字符串和编码
- 使用list和tuple
- 条件判断
- 循环
- 使用dict和set
- 函数
- 调用函数
- 定义函数
- 函数的参数
- 递归函数
- 高级特性
- 切片
- 迭代
- 列表生成式
- 生成器
- 迭代器
- 函数式编程
- 高阶函数
- map/reduce
- filter
- sorted
- 返回函数
- 匿名函数
- 装饰器
- 偏函数
- Python函数式编程——偏函数(来自博客)
- 模块
- 使用模块
- 安装第三方模块
- 面向对象编程
- 类和实例
- 访问限制
- 继承和多态
- 获取对象信息
- 实例属性和类属性
- 面向对象高级编程
- 使用__slots__
- 使用@property
- 多重继承
- 定制类
- 使用枚举类
- 使用元类
- 错误、调试和测试
- 错误处理
- 调试
- 单元测试
- 文档测试
- IO编程
- 文件读写
- StringIO和BytesIO
- 操作文件和目录
- 序列化
- 进程和线程
- 多进程
- 多线程
- ThreadLocal
- 进程 vs. 线程
- 分布式进程
- 正则表达式
- 常用内建模块
- datetime
- collections
- base64
- struct
- hashlib
- itertools
- contextlib
- XML
- HTMLParser
- urllib
- 常用第三方模块
- PIL
- virtualenv
- 图形界面
- 网络编程
- TCP/IP简介
- TCP编程
- UDP编程
- 电子邮件
- SMTP发送邮件
- POP3收取邮件
- 访问数据库
- 使用SQLite
- 使用MySQL
- 使用SQLAlchemy
- Web开发
- HTTP协议简介
- HTML简介
- WSGI接口
- 使用Web框架
- 使用模板
- 异步IO
- 协程
- asyncio
- async/await
- aiohttp
- 实战
- Day 1 - 搭建开发环境
- Day 2 - 编写Web App骨架
- Day 3 - 编写ORM
- Day 4 - 编写Model
- Day 5 - 编写Web框架
- Day 6 - 编写配置文件
- Day 7 - 编写MVC
- Day 8 - 构建前端
- Day 9 - 编写API
- Day 10 - 用户注册和登录
- Day 11 - 编写日志创建页
- Day 12 - 编写日志列表页
- Day 13 - 提升开发效率
- Day 14 - 完成Web App
- Day 15 - 部署Web App
- Day 16 - 编写移动App
- FAQ
- 期末总结