上一节中已经谈到,list是python的苦力,那么它都有哪些函数呢?或者它或者对它能做什么呢?在交互模式下这么操作,就看到有关它的函数了。
~~~
>>> dir(list)
['__add__', '__class__', '__contains__', '__delattr__', '__delitem__', '__delslice__', '__doc__', '__eq__', '__format__', '__ge__', '__getattribute__', '__getitem__', '__getslice__', '__gt__', '__hash__', '__iadd__', '__imul__', '__init__', '__iter__', '__le__', '__len__', '__lt__', '__mul__', '__ne__', '__new__', '__reduce__', '__reduce_ex__', '__repr__', '__reversed__', '__rmul__', '__setattr__', '__setitem__', '__setslice__', '__sizeof__', '__str__', '__subclasshook__', 'append', 'count', 'extend', 'index', 'insert', 'pop', 'remove', 'reverse', 'sort']
~~~
上面的结果中,以双下划线开始和结尾的暂时不管,如`__add__`(以后会管的)。就剩下以下几个了:
> 'append', 'count', 'extend', 'index', 'insert', 'pop', 'remove', 'reverse', 'sort'
下面注意对这些函数进行说明和演示。这都是在编程实践中常常要用到的。
## [](https://github.com/qiwsir/StarterLearningPython/blob/master/112.md#list函数)list函数
### [](https://github.com/qiwsir/StarterLearningPython/blob/master/112.md#append和extend)append和extend
[《列表(1)》](https://github.com/qiwsir/StarterLearningPython/blob/master/111.md)中,对list的基本操作提到了list.append(x),也就是将某个元素x 追加到已知的一个list后边。
除了将元素追加到list中,还能够将两个list合并,或者说将一个list追加到另外一个list中。按照前文的惯例,还是首先看[官方文档](https://docs.python.org/2/tutorial/datastructures.html)中的描述:
> list.extend(L)
>
> Extend the list by appending all the items in the given list; equivalent to a[len(a):] = L.
**向所有正在学习本内容的朋友提供一个成为优秀程序员的必备:看官方文档,是必须的。**
官方文档的这句话翻译过来:
> 通过将所有元素追加到已知list来扩充它,相当于a[len(a):]= L
英语太烂,翻译太差。直接看例子,更明白
~~~
>>> la
[1, 2, 3]
>>> lb
['qiwsir', 'python']
>>> la.extend(lb)
>>> la
[1, 2, 3, 'qiwsir', 'python']
>>> lb
['qiwsir', 'python']
~~~
上面的例子,显示了如何将两个list,一个是la,另外一个lb,将lb追加到la的后面,也就是把lb中的所有元素加入到la中,即让la扩容。
学程序一定要有好奇心,我在交互环境中,经常实验一下自己的想法,有时候是比较愚蠢的想法。
~~~
>>> la = [1,2,3]
>>> b = "abc"
>>> la.extend(b)
>>> la
[1, 2, 3, 'a', 'b', 'c']
>>> c = 5
>>> la.extend(c)
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
TypeError: 'int' object is not iterable
~~~
从上面的实验中,看官能够有什么心得?原来,如果extend(str)的时候,str被以字符为单位拆开,然后追加到la里面。
如果extend的对象是数值型,则报错。
所以,extend的对象是一个list,如果是str,则python会先把它按照字符为单位转化为list再追加到已知list。
不过,别忘记了前面官方文档的后半句话,它的意思是:
~~~
>>> la
[1, 2, 3, 'a', 'b', 'c']
>>> lb
['qiwsir', 'python']
>>> la[len(la):]=lb
>>> la
[1, 2, 3, 'a', 'b', 'c', 'qiwsir', 'python']
~~~
list.extend(L) 等效于 list[len(list):] = L,L是待并入的list
联想到到[上一讲](https://github.com/qiwsir/StarterLearningPython/blob/master/111.md)中的一个list函数list.append(),有类似之处。
> extend(...) L.extend(iterable) -- extend list by appending elements from the iterable
上面是在交互模式中输入`help(list.extend)`后得到的说明。这是非常重要而且简单的获得文档帮助的方法。
从上面内容可知,extend函数也是将另外的元素增加到一个已知列表中,其元素必须是iterable,什么是iterable?这个从现在开始,后面会经常遇到,所以是要搞搞清楚的。
> iterable,中文含义是“可迭代的”。在python中,还有一个词,就是iterator,这个叫做“迭代器”。这两者有着区别和联系。不过,这里暂且不说那么多,说多了就容易糊涂,我也糊涂了。
为了解释iterable(可迭代的),又引入了一个词“迭代”,什么是迭代呢?
> 尽管我们很多文档是用英文写的,但是,如果你能充分利用汉语来理解某些名词,是非常有帮助的。因为在汉语中,不仅仅表音,而且能从词语组合中体会到该术语的含义。比如“激光”,这是汉语。英语是从"light amplification by stimulated emission of radiation"化出来的"laser",它是一个造出来的词。因为此前人们不知道那种条件下发出来的是什么。但是汉语不然,反正用一个“光”就可以概括了,只不过这个“光”不是传统概念中的“光”,而是由于“受激”辐射得到的光,故名“激光”。是不是汉语很牛叉?
>
> “迭”在汉语中的意思是“屡次,反复”。如:高潮迭起。那么跟“代”组合,就可以理解为“反复‘代’”,是不是有点“子子孙孙”的意思了?“结婚-生子-子成长-结婚-生子-子成长-...”,你是不是也在这个“迭代”的过程中呢?
>
> 给个稍微严格的定义,来自维基百科。“迭代是重复反馈过程的活动,其目的通常是为了接近并到达所需的目标或结果。”
某些类型的对象是“可迭代”(iterable)的,这类数据类型有共同的特点。如何判断一个对象是不是可迭代的?下面演示一种方法。事实上还有别的方式。
~~~
>>> astr = "python"
>>> hasattr(astr,'__iter__')
False
~~~
这里用内建函数`hasattr()`判断一个字符串是否是可迭代的,返回了False。用同样的方式可以判断:
~~~
>>> alst = [1,2]
>>> hasattr(alst,'__iter__')
True
>>> hasattr(3, '__iter__')
False
~~~
`hasattr()`的判断本质就是看那个类型中是否有`__iter__`函数。看官可以用`dir()`找一找,在数字、字符串、列表中,谁有`__iter__`。同样还可找一找dict,tuple两种类型对象是否含有这个方法。
以上穿插了一个新的概念“iterable”(可迭代的),现在回到extend上。这个函数需要的参数就是iterable类型的对象。
~~~
>>> new = [1,2,3]
>>> lst = ['python','qiwsir']
>>> lst.extend(new)
>>> lst
['python', 'qiwsir', 1, 2, 3]
>>> new
[1, 2, 3]
~~~
通过extend函数,将[1,2,3]中的每个元素都拿出来,然后塞到lst里面,从而得到了一个跟原来的对象元素不一样的列表,后面的比原来的多了三个元素。上面说的有点啰嗦,只不过是为了把过程完整表达出来。
还要关注一下,从上面的演示中可以看出,lst经过extend函数操作之后,变成了一个貌似“新”的列表。这句话好像有点别扭,“貌似新”的,之所以这么说,是因为对“新的”可能有不同的理解。不妨深挖一下。
~~~
>>> new = [1,2,3]
>>> id(new)
3072383244L
>>> lst = ['python', 'qiwsir']
>>> id(lst)
3069501420L
~~~
用`id()`能够看到两个列表分别在内存中的“窝”的编号。
~~~
>>> lst.extend(new)
>>> lst
['python', 'qiwsir', 1, 2, 3]
>>> id(lst)
3069501420L
~~~
看官注意到没有,虽然lst经过`extend()`方法之后,比原来扩容了,但是,并没有离开原来的“窝”,也就是在内存中,还是“旧”的,只不过里面的内容增多了。相当于两口之家,经过一番云雨之后,又增加了一个小宝宝,那么这个家是“新”的还是“旧”的呢?角度不同或许说法不一了。
这就是列表的一个**重要特征:列表是可以修改的。这种修改,不是复制一个新的,而是在原地进行修改。**
其实,`append()`对列表的操作也是如此,不妨用同样的方式看看。
**说明:**虽然这里的lst内容和上面的一样,但是,我从新在shell中输入,所以id会变化。也就是内存分配的“窝”的编号变了。
~~~
>>> lst = ['python','qiwsir']
>>> id(lst)
3069501388L
>>> lst.append(new)
>>> lst
['python', 'qiwsir', [1, 2, 3]]
>>> id(lst)
3069501388L
~~~
显然,`append()`也是原地修改列表。
如果,对于`extend()`,提供的不是iterable类型对象,会如何呢?
~~~
>>> lst.extend("itdiffer")
>>> lst
['python', 'qiwsir', 'i', 't', 'd', 'i', 'f', 'f', 'e', 'r']
~~~
它把一个字符串"itdiffer"转化为['i', 't', 'd', 'i', 'f', 'f', 'e', 'r'],然后将这个列表作为参数,提供给extend,并将列表中的元素塞入原来的列表中。
~~~
>>> num_lst = [1,2,3]
>>> num_lst.extend(8)
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
TypeError: 'int' object is not iterable
~~~
这就报错了。错误提示中告诉我们,那个数字8,是int类型的对象,不是iterable的。
这里讲述的两个让列表扩容的函数`append()`和`extend()`。从上面的演示中,可以看到他们有相同的地方:
* 都是原地修改列表
* 既然是原地修改,就不返回值
原地修改没有返回值,就不能赋值给某个变量。
~~~
>>> one = ["good","good","study"]
>>> another = one.extend(["day","day","up"]) #对于没有提供返回值的函数,如果要这样,结果是:
>>> another #这样的,什么也没有得到。
>>> one
['good', 'good', 'study', 'day', 'day', 'up']
~~~
那么两者有什么不一样呢?看下面例子:
~~~
>>> lst = [1,2,3]
>>> lst.append(["qiwsir","github"])
>>> lst
[1, 2, 3, ['qiwsir', 'github']] #append的结果
>>> len(lst)
4
>>> lst2 = [1,2,3]
>>> lst2.extend(["qiwsir","github"])
>>> lst2
[1, 2, 3, 'qiwsir', 'github'] #extend的结果
>>> len(lst2)
5
~~~
append是整建制地追加,extend是个体化扩编。
### [](https://github.com/qiwsir/StarterLearningPython/blob/master/112.md#count)count
上面的len(L),可得到list的长度,也就是list中有多少个元素。python的list还有一个函数,就是数一数某个元素在该list中出现多少次,也就是某个元素有多少个。官方文档是这么说的:
> list.count(x)
>
> Return the number of times x appears in the list.
一定要不断实验,才能理解文档中精炼的表达。
~~~
>>> la = [1,2,1,1,3]
>>> la.count(1)
3
>>> la.append('a')
>>> la.append('a')
>>> la
[1, 2, 1, 1, 3, 'a', 'a']
>>> la.count('a')
2
>>> la.count(2)
1
>>> la.count(5) #NOTE:la中没有5,但是如果用这种方法找,不报错,返回的是数字0
0
~~~
### [](https://github.com/qiwsir/StarterLearningPython/blob/master/112.md#index)index
[《列表(1)》](https://github.com/qiwsir/StarterLearningPython/blob/master/111.md)中已经提到,这里不赘述,但是为了完整,也占个位置吧。
~~~
>>> la
[1, 2, 3, 'a', 'b', 'c', 'qiwsir', 'python']
>>> la.index(3)
2
>>> la.index('qi') #如果不存在,就报错
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
ValueError: 'qi' is not in list
>>> la.index('qiwsir')
6
~~~
list.index(x),x是list中的一个元素,这样就能够检索到该元素在list中的位置了。这才是真正的索引,注意那个英文单词index。
依然是上一条官方解释:
> list.index(x)
>
> Return the index in the list of the first item whose value is x. It is an error if there is no such item.
是不是说的非常清楚明白了?
- 第零章 预备
- 关于Python的故事
- 从小工到专家
- Python安装
- 集成开发环境
- 第壹章 基本数据类型
- 数和四则运算
- 除法
- 常用数学函数和运算优先级
- 写一个简单的程序
- 字符串(1)
- 字符串(2)
- 字符串(3)
- 字符串(4)
- 字符编码
- 列表(1)
- 列表(2)
- 列表(3)
- 回顾list和str
- 元组
- 字典(1)
- 字典(2)
- 集合(1)
- 集合(2)
- 第贰章 语句和文件
- 运算符
- 语句(1)
- 语句(2)
- 语句(3)
- 语句(4)
- 语句(5)
- 文件(1)
- 文件(2)
- 迭代
- 练习
- 自省
- 第叁章 函数
- 函数(1)
- 函数(2)
- 函数(3)
- 函数(4)
- 函数练习
- 第肆章 类
- 类(1)
- 类(2)
- 类(3)
- 类(4)
- 类(5)
- 多态和封装
- 特殊方法(1)
- 特殊方法(2)
- 迭代器
- 生成器
- 上下文管理器
- 第伍章 错误和异常
- 错误和异常(1)
- 错误和异常(2)
- 错误和异常(3)
- 第陆章 模块
- 编写模块
- 标准库(1)
- 标准库(2)
- 标准库(3)
- 标准库(4)
- 标准库(5)
- 标准库(6)
- 标准库(7)
- 标准库(8)
- 第三方库
- 第柒章 保存数据
- 将数据存入文件
- mysql数据库(1)
- MySQL数据库(2)
- mongodb数据库(1)
- SQLite数据库
- 电子表格
- 第捌章 用Tornado做网站
- 为做网站而准备
- 分析Hello
- 用tornado做网站(1)
- 用tornado做网站(2)
- 用tornado做网站(3)
- 用tornado做网站(4)
- 用tornado做网站(5)
- 用tornado做网站(6)
- 用tornado做网站(7)
- 第玖章 科学计算
- 为计算做准备
- Pandas使用(1)
- Pandas使用(2)
- 处理股票数据
- 附:网络文摘
- 如何成为Python高手
- ASCII、Unicode、GBK和UTF-8字符编码的区别联系