Python 学习笔记基础篇 · Jims 的学习笔记

# Python 学习笔记基础篇整理：Jims of [肥肥世家](http://www.ringkee.com) [jims.yang@gmail.com](mailto:jims.yang@gmail.com) Copyright © 2004，2005，2006 本文遵从GNU 的自由文档许可证(Free Document License)的条款，欢迎转载、修改、散布。发布时间：2004年07月10日更新时间：2006年06月14日，把参考篇的内容合并进来。 **Abstract** 现时国内python的中文资料极少，使学习Python较困难。国外的资料虽多，但都是英文的，使我们学习起来很不方便。有鉴于此，我开始了Python中文资料库的整理工作，以推动Python的发展和在中国的应用。在自由的世界里，正因为有你的支持和帮助，才使我得以不断前进。我相信我们每人一小步就可带动python在中国前进一大步。  **Table of Contents** + [1\. 绪论](#id2875104) + [1.1\. Python历史](#id2811704) + [1.2\. Python功能简介](#id2811781) + [1.3\. 应用范围](#id2810170) + [1.4\. 如何开始？](#id2810267) + [2\. Python编程习惯与特点](#id2861425) + [2.1\. 代码风格](#id2861433) + [2.2\. 保留字](#id2861575) + [2.3\. Python运算符和表达式](#id2861594) + [2.3.1\. Python运算符](#id2861602) + [2.3.2\. 运算符优先顺序](#id2861844) + [2.3.3\. 真值表](#id2808594) + [2.3.4\. 复合表达式](#id2808746) + [2.4\. 给变量赋值](#id2808820) + [3\. Python内建对象类型](#id2808911) + [3.1\. Number数值型](#id2808928) + [3.2\. String字符串型](#id2809008) + [3.2.1\. 字符串的格式化](#id2809192) + [3.2.2\. 转义字符](#id2809469) + [3.2.3\. Unicode字符串](#id2875369) + [3.2.4\. 原始字符串](#id2875512) + [3.3\. List列表](#id2875536) + [3.4\. Tuple元组](#id2875904) + [3.5\. 序列对象](#id2875979) + [3.6\. Dictionary字典](#id2876078) + [3.7\. File文件](#id2876321) + [3.8\. 理解引用](#id2876343) + [3.9\. copy and deepcopy](#id2876409) + [3.10\. 标识数据类型](#id2876486) + [3.11\. 数组对象](#id2876523) + [4\. 控制语句](#id2876868) + [5\. 函数](#id2877126) + [5.1\. 常用函数](#id2877464) + [5.2\. 内置类型转换函数](#id2877751) + [5.3\. 序列处理函数](#id2878060) + [6\. 模块](#id2878241) + [6.1\. String模块](#id2878430) + [6.2\. time模块](#id2878537) + [7\. 类](#id2878619) + [8\. 异常处理](#id2878694) + [9\. 文件处理](#id2878856) + [9.1\. 文件处理的函数和方法](#id2878871) + [9.2\. 示例](#id2879330) + [10\. 正则表达式](#id2879657) + [10.1\. 基本元素](#id2879700) + [10.2\. 操作](#id2880568) + [11\. 调试](#id2881059) + [12\. HOW-TO](#id2881117) ## Chapter 1\. 绪论 ## 1.1\. Python历史 Python是一种开源的面向对象的脚本语言，它起源于1989年末，当时，CWI（阿姆斯特丹国家数学和计算机科学研究所）的研究员Guido van Rossum需要一种高级脚本编程语言，为其研究小组的Amoeba分布式操作系统执行管理任务。为创建新语言，他从高级数学语言ABC（ALL BASIC CODE）汲取了大量语法，并从系统编程语言Modula-3借鉴了错语处理机制。Van Rossum把这种新的语言命名为Python（大蟒蛇）---来源于BBC当时正在热播的喜剧连续剧“Monty Python”。 Python于1991年初公开发行，由于功能强大和采用开源方式发行，Python的发展得很快，用户越来越多，形成了一个强大的社区力量。2001年，Python的核心开发团队移师Digital Creations公司，该公司是Zope（一个用Python编写的web应用服务器）的创始者。现在最新的版本是python2.3.4，大家可到[http://www.python.org](http://www.python.org)上了解最新的Python动态和资料。 ## 1.2\. Python功能简介 Python是一种解析性的，交互式的，面向对象的编程语言，类似于Perl、Tcl、Scheme或Java。 Python一些主要功能介绍: * Python使用一种优雅的语法，可读性强。 * Python是一种很灵活的语言，能帮你轻松完成编程工作。并可作为一种原型开发语言，加快大型程序的开发速度。 * 有多种数据类型：numbers (integers, floating point, complex, and unlimited-length long integers), strings (ASCII 和 Unicode), lists, dictionaries。 * Python支持类和多层继承等的面向对象编程技术。 * 代码能打包成模块和包，方便管理和发布。 * 支持异常处理，能有效捕获和处理程序中发生的错误。 * 强大的动态数据类型支持，不同数据类型相加会引发一个异常。 * Python支持如生成器和列表嵌套等高级编程功能。 * 自动内存碎片管理，有效利用内存资源。 * 强大的类库支持，使编写文件处理、正则表达式，网络连接等程序变得相当容易。 * Python的交互命令行模块能方便地进行小代码调试和学习。 * Python易于扩展，可以通过C或C++编写的模块进行功能扩展。 * Python解析器可作为一个编程接口嵌入一个应用程序中。 * Python可运行在多种计算机平台和操作系统中，如各位unix，windows，MacOS,OS/2等等。 * Python是开源的，可自由免费使用和发布，并且可用于商业用途以获取利润。如想详细了解Python的许可协议可到以下网址查询[http://www.python.org/psf/license.html](http://www.python.org/psf/license.html) ## 1.3\. 应用范围 * 系统编程，提供大量系统接口API，能方便进行系统维护和管理。 * 图形处理，有PIL、Tkinter等图形库支持，能方便进行图形处理。 * 数学处理，NumPy扩展提供大量与许多标准数学库的接口， * 文本处理，python提供的re模块能支持正则表达式，还提供SGML，XML分析模块，许多程序员利用python进行XML程序的开发。 * 数据库编程，程序员可通过遵循Python DB-API（数据库应用程序编程接口）规范的模块与Microsoft SQL Server，Oracle，Sybase，DB2，Mysql等数据库通信。python自带有一个Gadfly模块，提供了一个完整的SQL环境。 * 网络编程，提供丰富的模块支持sockets编程，能方便快速地开发分布式应用程序。 * 作为Web应用的开发语言，支持最新的XML技术。 * 多媒体应用，Python的PyOpenGL模块封装了“OpenGL应用程序编程接口”，能进行二维和三维图像处理。PyGame模块可用于编写游戏软件。 ## 1.4\. 如何开始？ * 进入交互命令行方式。如果是linux类的系统，python解析器应该已经安装在/usr/local/bin/python中，直接打python就可进入交互式命令行界面，如下所示: ``` Python 2.3.3 (#1, Apr 27 2004, 15:17:58) [GCC 3.2 20020903 (Red Hat Linux 8.0 3.2-7)] on linux2 Type "help", "copyright", "credits" or "license" for more information. >>> ``` “>>>”符号是Python命令行界面的提示符，可按CTRL+D退出，如果是windows环境的话就要按CTRL+Z了。还可以用以下命令退出命令行界面：“import sys；sys.exit()”。如果是windows系统，可到[http://www.python.org/download/](http://www.python.org/download/)下载最新的安装程序进行安装。安装完成后直接打python也可进入命令行界面。命令行是python最简单直观，也是最方便的一种执行环境，我们可以在这里学习python语法和调试程序。如果要打印"hello world"可以输入以下命令： ``` >>>print "hello world" hello world ``` * 以模块文件方式运行。模块文件是包含python语句的文本，以.py结尾。运行模块文件只要输入python xxx.py就可以了。 * 以linux脚本方式运行。和shell脚本差不多，以vi或其它文本编辑器输入以下内容: ``` #!/usr/local/bin/python print "test ............" ``` 存盘后，把文件属性改为可执行，就可象shell脚本一样执行了。 * **Table 1.1\. Python命令行选项** ``` | 选项 | 作用 | | --- | --- | | -c cmd | 在命令行直接执行python代码。如python -c 'print "hello world"'。 | | -d | 脚本编译后从解释器产生调试信息。同PYTHONDEBUG=1。 | | -E | 忽略环境变量。 | | -h | 显示python命令行选项帮助信息。 | | -i | 脚本执行后马上进入交互命令行模式。同PYTHONINSPECT=1。 | | -O | 在执行前对解释器产生的字节码进行优化。同 PYTHONOPTIMIZE=1。 | | -OO | 在执行前对解释器产生的字节码进行优化，并删除优化代码中的嵌入式文档字符串。 | | -Q arg | 除法规则选项，-Qold(default)，-Qwarn，-Qwarnall，-Qnew。 | | -S | 解释器不自动导入site.py模块。 | | -t | 当脚本的tab缩排格式不一致时产生警告。 | | -u | 不缓冲stdin、stdout和stderr，默认是缓冲的。同PYTHONUNBUFFERED=1。 | | -v | 产生每个模块的信息。如果两个-v选项，则产生更详细的信息。同PYTHONVERBOSE=x。 | | -V | 显示Python的版本信息。 | | -W arg | 出错信息控制。(arg is action:message:category:module:lineno) | | -x | 忽略源文件的首行。要在多平台上执行脚本时有用。 | | file | 执行file里的代码。 | | - | 从stdin里读取执行代码。 | ``` ## Chapter 2\. Python编程习惯与特点 ## 2.1\. 代码风格 * 在Python中，每行程序以换行符代表结束，如果一行程序太长的话，可以用“\”符号扩展到下一行。在python中以三引号(""")括起来的字符串，列表，元组和字典都能跨行使用。并且以小括号(...)、中括号[...]和大括号{...}包围的代码不用加“\”符也可扩展到多行。如： * 在Python中是以缩进来区分程序功能块的，缩进的长度不受限制，但就一个功能块来讲，最好保持一致的缩进量。 * 如果一行中有多条语句，语句间要以分号（;）分隔。 * 以“#”号开头的内容为注释，python解释器会忽略该行内容。 * 在python中，所有标识符可以包括英文、数字以及下划线（\_），但不能以数字开头。python中的标识符是区分大小写的。 * 以下划线开头的标识符是有特殊意义的。以单下划线开头（\_foo）的代表不能直接访问的类属性，需通过类提供的接口进行访问，不能用“from xxx import \*”而导入；以双下划线开头的（\_\_foo）代表类的私有成员；以双下划线开头和结尾的（\_\_foo\_\_）代表python里特殊方法专用的标识，如\_\_init\_\_（）代表类的构造函数。 * 在交互模式下运行python时，一个下划线字符(\_)是特殊标识符，它保留了表达式的最后一个计算结果。 ``` >>> "hello" 'hello' >>> _ 'hello' >>> 10+10 20 >>> _ 20 ``` * 在python中，函数、类、模块定义的第一段代码如果是字符串的话，就把它叫作文件字串，可通过\_\_doc\_\_属性访问。如: ``` def test(): "this is a document string" return 100+1000 >>>print test.__doc__ this is a document string ``` ## 2.2\. 保留字 ``` and elif global or yield assert else if pass break except import print class exec in raise continue finally is return def for lambda try del from not while ``` ## 2.3\. Python运算符和表达式 ### 2.3.1\. Python运算符 **Table 2.1\. Python运算符列表** | 运算符 | 描述 | | --- | --- | | x+y，x-y | 加、减，“+”号可重载为连接符 | | x\*y，x\*\*y，x/y，x%y | 相乘、求平方、相除、求余，“*”号可重载为重复，“%”号可重载为格式化 | | <，<=，>，>=，==，<>，!= | 比较运算符 | | +=，-=，\*=，/=，%=，\*\*=，<<=，>>=，&=，^=，|= | 自变运算符 | | x|y | 按位或 | | x^y | 按位异或 | | x&y | 按位与 | | ~x | 按位取反 | | x<<，x>>y | x向左或向右移y位 | | is, is not | 等同测试 | | in, not in | 是否为成员测试 | | or，and，not | 逻辑运算符 | | x[i]，x[i:j]，x.y，x(...) | 索引，分片，限定引用，函数调用 | | (...)，[...]，{...}，'...' | 元组，列表，字典，转化为字符串 | ### 2.3.2\. 运算符优先顺序 **Table 2.2\. 运算符优先顺序列表(从最高到最低)** | 运算符 | 描述 | | --- | --- | | 'expr' | 字符串转换 | | {key:expr,...} | 字典 | | [expr1,expr2...] | 列表 | | (expr1,expr2,...) | 元组 | | function(expr,...) | 函数调用 | | x[index:index] | 切片 | | x[index] | 下标索引取值 | | x.attribute | 属性引用 | | ~x | 按位取反 | | +x，-x | 正，负 | | x\*\*y | 幂 | | x\*y，x/y，x%y | 乘，除，取模 | | x+y，x-y | 加，减 | | x<<y，x>>y | 移位 | | x&y | 按位与 | | x^y | 按位异或 | | x|y | 按位或 | | x<y，x<=y，x==y，x!=y，x>=y，x>y | 比较 | | x is y，x is not y | 等同测试 | | x in y，x not in y | 成员判断 | | not x | 逻辑否 | | x and y | 逻辑与 | | x or y | 逻辑或 | | lambda arg,...:expr | Lambda匿名函数 | ### 2.3.3\. 真值表 **Table 2.3\.** | 对象/常量 | 值 | | --- | --- | | "" | 假 | | "string" | 真 | | 0 | 假 | | >=1 | 真 | | <=-1 | 真 | | ()空元组 | 假 | | []空列表 | 假 | | {}空字典 | 假 | | None | 假 | ### 2.3.4\. 复合表达式 * 对于and，当计算a and b时，python会计算a，如果a为假，则取a值，如果a为真，则python会计算b且整个表达式会取b值。如： ``` >>> a,b=10,20 >>> a and b #a is true 20 >>> a,b=0,5 #a is false >>> a and b 0 ``` * 对于or，当计算a or b时，python会计算a，如果a为真，则整个表达式取a值，如果a为假，表达式将取b值。如： ``` >>> a,b=10,20 >>> a or b 10 >>> a,b=0,5 >>> a or b 5 ``` * 对于not，not将反转表表达式的“实际值”，如果表达式为真，not为返回假，如为表达式为假，not为返回真。如： ``` >>> not 2 False >>> not 0 True >>> not "test" False >>> not "" True ``` ## 2.4\. 给变量赋值 * 简单赋值，Variable(变量)=Value(值)。 ``` >>>a=1 >>>b=2 >>>print a,b 1 2 ``` * 多变量赋值，Variable1,variable2,...=Value1,Value2,... ``` >>>a,b,c=1,2,3 >>>print a 1 >>>print b 2 >>>print c 3 ``` 多变量赋值也可用于变量交换，接上例： ``` >>>a,b,c=c,b,a >>>print a 3 >>>print b 2 >>>print c 1 ``` * 多目标赋值，a=b=variable ``` >>> a=b=1 >>> a 1 >>> b 1 >>> a=2 >>> a 2 >>> b 1 ``` * 自变赋值，如+=，-=，*=等。在自变赋值中，python仅计算一次，而普通写法需计算两次；自变赋值会修改原始对象，而不是创建一个新对象。 ## Chapter 3\. Python内建对象类型在Python中，所有数据都是对象，数据有各种类型，如数值型、列表型、字符串型等。除系统内建的数据类型外，程序员也可以创建自已的数据类型。以下主要介绍Python内建的数据类型。 ## 3.1\. Number数值型在python中，数值有四种类型，分别是整型、长整形、浮点型和复数。 * 整型---从-2147483648至2147483647，有符号位32位长，可表达的最大数为2^31-1。如：number=123，number1=-123。在数字前加0x或0X 前缀表示十六进制数，在数字前加前缀0表示八进制数，与C/C++ and perl一样。 > 为方便起见，sys模块包含一个maxint成员，该成员保留了整形变量的最大正数值。 ``` >>> import sys >>> print sys.maxint 2147483647 ``` * 长整型---python支持任意长度的长整型，长整型的最大值和最小值由可用的内存确定。长整型数在数字常量尾加L or l，一般都是用L，因为小写的l太容易与数字1混淆了。如：long=1232132131231232132132131L。 * 浮点数---python支持普通十进制和科学计数法表示的浮点数。如：number=123.456，nubmer1=123.2E10。浮点数在python中的存储格式与C中的双精度数相同。 * 复数---复数的实部和虚部用加号分开，虚部使用后缀j表示，如：number=1.2+2j ## 3.2\. String字符串型 * 字符串在python被看成是单个字符的序列，具有序列对象的特殊功能，字符串是固定的，不可变的。如：string="hello world"。 * 可在字符串中使用单引号和双引号。如：string="I'm a boy"。 * 字符串内部的一个反斜杠“\”可允许把字符串放于多行：如： ``` >>> "test \ ... python" 'test python' ``` * 使用三个单引号或双引号可使字符串跨行显示。如： ``` helptext="""this a help test.if you have any quesions. please call me anytime.I will help you.I like python.I hope so as you.""" ``` * 使用“+”号可连接字符串。如：string = "hello" + "world"，注意，不能将字符串与其它对象进行连接。如string = "ok" + 5。其实不用“+”号，直接用空格也可连接两个字符串。如：string="hello" "world"。 * 可用“\*”号重复字符串，如：'hello'\*5会生成'hellohellohellohellohello'。 * 可用索引访问字符串中的字符。如：string="hello world"，print string[1]将显示字符e。 * 字符串可用in或not in运算符来测试字符是不属于一个字符串的成员。 * 可对字符串分片，如string="hello world",print string[6:]将显示world。分片的格式为： ``` string[start:end] ``` 分片和索引的规则如下： * 返回的字符串包含从start起始到end但不包括end结束的所有字符。 * 若指定了start但未指定end，则一直向后分片，直至字符串结束。 * 若指定了end但未指定start，则从0开始分片直至end，但不包括end指定的字符。 * 若start和end为负数，则索引从字符串尾部开始算起，最后一个字符为-1。 python提供了一个string模块来进行字符串处理。 ### 3.2.1\. 字符串的格式化象C 中的sprintf函数一样，可以用“%”来格式化字符串。 **Table 3.1\. 字符串格式化代码** | 格式 | 描述 | | --- | --- | | %% | 百分号标记 | | %c | 字符及其ASCII码 | | %s | 字符串 | | %d | 有符号整数(十进制) | | %u | 无符号整数(十进制) | | %o | 无符号整数(八进制) | | %x | 无符号整数(十六进制) | | %X | 无符号整数(十六进制大写字符) | | %e | 浮点数字(科学计数法) | | %E | 浮点数字(科学计数法，用E代替e) | | %f | 浮点数字(用小数点符号) | | %g | 浮点数字(根据值的大小采用%e或%f) | | %G | 浮点数字(类似于%g) | | %p | 指针(用十六进制打印值的内存地址) | | %n | 存储输出字符的数量放进参数列表的下一个变量中 | > %格式化符也可用于字典，可用%(name)引用字典中的元素进行格式化输出。 > 负号指时数字应该是左对齐的，“0”告诉Python用前导0填充数字，正号指时数字总是显示它的正负(+，-)符号，即使数字是正数也不例外。 > 可指定最小的字段宽度，如："%5d" % 2。也可用句点符指定附加的精度，如："%.3d" % 3。 ### 3.2.2\. 转义字符在需要在字符中使用特殊字符时，python用反斜杠(\)转义字符。如下表： **Table 3.2\. python支持的转义字符表** | 转义字符 | 描述 | | --- | --- | | \(在行尾时) | 续行符 | | \\ | 反斜杠符号 | | \' | 单引号 | | \" | 双引号 | | \a | 响铃 | | \b | 退格(Backspace) | | \e | 转义 | | \000 | 空 | | \n | 换行 | | \v | 纵向制表符 | | \t | 横向制表符 | | \r | 回车 | | \f | 换页 | | \oyy | 八进制数yy代表的字符，例如：\o12代表换行 | | \xyy | 十进制数yy代表的字符，例如：\x0a代表换行 | | \other | 其它的字符以普通格式输出 | ### 3.2.3\. Unicode字符串在python2.0中才完全支持Unicode字符串，Unicode字符采用16位(0---65535)值表示，能进行多语言支持。要使用Unicode字符串，只要在字符串前加上“u”即可。如： ``` >>> a=u"test" >>> print a test ``` 原始Unicode字符串用ur前缀，如： ``` >>> u'hello world\0020' u'hello world\x020' >>> ur'hello world\0020' u'hello world\\0020' ``` #### 3.2.3.1\. Unicode转换只要和Unicode连接，就会产生Unicode字串。如： ``` >>> 'help' 'help' >>> 'help，' + u'python' u'help，python' ``` 对于ASCII(7位)兼容的字串，可和内置的str()函数把Unicode字串转换成ASCII字串。如： ``` >>> str(u'hello world') 'hello world' ``` > 转换非ASCII兼容的字串会出错。编码和译码字符串时的错误引发UnicodeError异常。可使用encode()函数转换Unicode字串格式： ``` u'unicode\xb1\xe0\xc2\xeb\xb2\xe2\xca\xd4' >>> a.encode('utf-8') #转换成utf-8，显示结果会根据终端的字符集支持不同而不同，下面是在GB18030下的显示结果 'unicode\xc2\xb1\xc3\xa0\xc3\x82\xc3\xab\xc2\xb2\xc3\xa2\xc3\x8a\xc3\x94' ``` 可使用unicode()函数把字符串转换成unicode格式，如： ``` >>> a=u'unicode测试' >>> a u'unicode\xb2\xe2\xca\xd4' >>> a.encode('utf-8') #把unicode字串转换成utf-8 'unicode\xc2\xb2\xc3\xa2\xc3\x8a\xc3\x94' >>> b=a.encode('utf-8') #给变量b赋值 >>> b 'unicode\xc2\xb2\xc3\xa2\xc3\x8a\xc3\x94' >>>unicode(b,'utf-8') #用unicode()函数把utf-8格式字串转换回unicode格式。 u'unicode\xb2\xe2\xca\xd4' #和原始的这是a相同 ``` ord()支持unicode，可以显示特定字符的unicode号码，如： ``` >>>ord('A') 65 ``` 使用unichr()函数可将unicode号码转换回unicode字符，如： ``` >>> unichr(65) u'A' ``` ### 3.2.4\. 原始字符串有时我们并不想让转义字符生效，我们只想显示字符串原来的意思，这就要用r和R来定义原始字符串。如： ``` print r'\t\r' ``` 实际输出为“\t\r”。 ## 3.3\. List列表 * 列表是序列对象，可包含任意的Python数据信息，如字符串、数字、列表、元组等。列表的数据是可变的，我们可通过对象方法对列表中的数据进行增加、修改、删除等操作。可以通过list(seq)函数把一个序列类型转换成一个列表。列表的几个例子： * `list = [ "a", "b", "c" ]`，这是字符列表。 * `list = [ 1, 2, 3, 4 ]`，这是数字列表。 * `list = [ [1,2,3,4], ["a","b","c"] ]`，这是列表的列表。 * `list = [ (1,2,3,4), ("a","b","c") ]`，这是元组列表。 * list((1,2))把一个元组转换成一个列表[1,2]，list('test')可把字符串转换成['t','e','s','t']列表。 * 访问列表可通过索引来引用，如：list[0]将引用列表的第一个值。list[0:1]返回第一和第二个元素。 * 用range()和xrange()函数可自动生成列表，具体用法请参考“python参考篇”的内容。 * 可通过列表综合来创建列表，该功能是在python2.0版本中新增加的。如果想对列表中的每个项进行运算并把结果存储在一个新列表中，可者想创建一个仅包含特定满足某种条件的项，采用该方法是很适合的。如：[x\*x for x in range(1,10)]会得到一个X的平方的新列表；我们还可添加if条件控制输出，如：[x\*x for x in range(1,10) if x%2==0]；还可在列表中使用多个for语句，如： ``` >>> [x+y for x in "123" for y in "abc"] ['1a', '1b', '1c', '2a', '2b', '2c', '3a', '3b', '3c'] ``` x,y值可取列表或元组等，以构成更复杂的结构。 * “+”号可连接两个列表。 * 访问列表的列表(嵌套列表)可用list[1][0]，这将访问嵌套中的第二个列表的第一个元素。 * 可用数字与列表相乘以复制内容，如：list\*2会得到一个[1,2,3,4,1,2,3,4]的列表。注意，不能用列表与列表相乘。 * 由于列表是可变的，我们可用赋值语句进行操作，如：list[0] = 2。 * 列表对象方法可对列表进行操作，如列表内容的添加，删除，排序等。如list.sort()可对list列表进行排序。 **Table 3.3\. 列表对象支持的方法** ``` | 方法 | 描述 | | --- | --- | | append(x) | 在列表尾部追加单个对象x。使用多个参数会引起异常。 | | count(x) | 返回对象x在列表中出现的次数。 | | extend(L) | 将列表L中的表项添加到列表中。返回None。 | | Index(x) | 返回列表中匹配对象x的第一个列表项的索引。无匹配元素时产生异常。 | | insert(i,x) | 在索引为i的元素前插入对象x。如list.insert(0,x)在第一项前插入对象。返回None。 | | pop(x) | 删除列表中索引为x的表项，并返回该表项的值。若未指定索引，pop返回列表最后一项。 | | remove(x) | 删除列表中匹配对象x的第一个元素。匹配元素时产生异常。返回None。 | | reverse() | 颠倒列表元素的顺序。 | | sort() | 对列表排序，返回none。bisect模块可用于排序列表项的添加和删除。 | ``` ## 3.4\. Tuple元组 Tuple(元组)和List(列表)很相似，但元组是不可变的。不能对元组中的元素进行添加，修改和删除操作。如果需修改元组内容只有重建元组。元组用小括号来表示。如tuple=(1,2,3)。 * tuple=(1,)，这是单个元素的元组表示，需加额外的逗号。 * tuple=1，2，3，4，这也可以是一个元组，在不使用圆括号而不会导致混淆时，Python允许不使用圆括号的元组。 * 和列表一样，可对元组进行索引、分片、连接和重复。也可用len()求元组长度。 > 元组的索引用tuple[i]的形式，而不是tuple(i)。 * 和列表类似，使用tuple(seq)可把其它序列类型转换成元组。 ## 3.5\. 序列对象上面介绍的字符串、列表和元组的对象类型均属于称为序列的Python对象。它是一种可使用数字化索引进行访问其中元素的对象。 * 可用算术运算符联接或重复序列。 * 比较运算符(<，<=，>，>=，!=，==)也可用于序列。 * 可通过下标(test[1])，切片(test[1:3])和解包来访问序列的某部份。解包示例如下： ``` >>>s=1,2,3 >>>x,y,z=s >>>print x,y,z 1,2,3 ``` * in运算符可判断当有对象是否序列对象成员，如: ``` >>>list = [1,2,3] >>>1 in list 1 >>>4 in list 0 ``` * 也可通过循环运算符对序列对象进行迭代操作。如: ``` for day in days: print day ``` 有关序列的处理函数请参考“python参考篇”相关内容，这里就不详细讲了。 ## 3.6\. Dictionary字典字典是一个用大括号括起来的键值对，字典元素分为两部份，键(key)和值。字典是python中唯一内置映射数据类型。通过指定的键从字典访问值。如： ``` monthdays = { "Jan":31, "Feb":28, "Mar":31, "Apr":30, "May":31, "Jun":30, "Jul":31, "Aug":31, "Sep":30, "Oct":31, "Nov":30,"Dec":31 } ``` * 字典可嵌套，可以在一个字典里包含另一个字典。如test={"test":{"mytest":10} } * 可用键访问字典，如monthdays["Jan"]，可访问值31。如果没有找到指定的键，则解释器会引起异常。 * 字典是可修改，如monthdays["Jan"]=30，可把Jan的值由31改为30。如monthdays["test"]=30可添加一个新键值对。 * del monthdays["test"]可删除字典条目。 * 字典不属序列对象，所以不能进行连接和相乘操作。字典是没有顺序的。 * 字典提供keys和values方法，用来返回字典中定义的所有键和值。 * 和列表一样，字典也提供了对象方法来对字典进行操作。 **Table 3.4\. 字典方法** ``` | 方法 | 描述 | | --- | --- | | has_key(x) | 如果字典中有键x，则返回真。 | | keys() | 返回字典中键的列表 | | values() | 返回字典中值的列表。 | | items() | 返回tuples的列表。每个tuple由字典的键和相应值组成。 | | clear() | 删除字典的所有条目。 | | copy() | 返回字典高层结构的一个拷贝，但不复制嵌入结构，而只复制对那些结构的引用。 | | update(x) | 用字典x中的键值对更新字典内容。 | | get(x[,y]) | 返回键x，若未找到该键返回none，若提供y，则未找到x时返回y。 | ``` ## 3.7\. File文件可用内置的open()函数对文件进行操作。如： ``` input = open("test.txt") for line in input.readlines(): print line input.close() ``` ## 3.8\. 理解引用 * Python把一块数据存储在对象中，变量是对象的唯一引用；它们是计算机内存中特殊地点的名字。所有对象都具有唯一的身份号、类型和值。对象的类型不会改变，对于可变类型而言，它的值是可变的。id(obj)函数可用于检索对象的身份，也就是内存中的对象的地址。 * 每个对象都包含引用计数器，它记录当前有多少个变量正在引用该对象。当给对象指定一个变量或使对象成为列表或其它包容器的成员时，引用计数就增加；当从包容器中撤消、重新分配或删除对象时，引用计数减少。当引用计数达到0值时(即没有任何变量引用这个对象)，python的回收机制会自动回收它使用的内存。注意，del可用来删除变量，但不能删除对象。 > sys.gettrefcount(obj)函数可返回给定对象的引用计数。 ## 3.9\. copy and deepcopy 通过给列表分配一个变量能创建对列表的引用，如果要创建列表的副本就要理解浅副本和深副本的概念。 * 列表或其他包容器对象的浅副本(Shallow)能够生成对象本身的副本，但也会创建对由列表包含的对象的引用。可用分片(object[:])和copy模块的copy(obj)函数创建。 * 列表或其他对象包容器对象的深副本能够生成对象本身的副本，并递归地生成所有子对象的副本。可用copy模块的deepcopy(obj)函数创建。比较两种副本，一般情况下表现一样，但当列表内包含另一个列表的情况下，父列表的浅副本将包含对子列表引用，而不是独立副本。其结果是，当更改内部列表时，从父列表的两个副本中都可见，如： ``` >>> a=[1,2,3,[4,5]] >>> b=a[:] >>> b [1, 2, 3, [4, 5]] >>> a[3].remove(4) >>> a [1, 2, 3, [5]] >>> b [1, 2, 3, [5]] ``` 如果是深副本，就不会出现这种情况。如： ``` >>> a=[1,2,3,[4,5]] >>> b=copy.deepcopy(a) >>> b [1, 2, 3, [4, 5]] >>> a[3].remove(4) >>> a [1, 2, 3, [5]] >>> b [1, 2, 3, [4, 5]] ``` ## 3.10\. 标识数据类型可通过type(obj)函数标识数据类型，如： ``` >>> type(a) <type 'list'> >>> type(copy) <type 'module'> >>> type(1) <type 'int'> ``` types模块包含Python的内置数据类型的类型对象。如： ``` >>> import types >>> types.ListType <type 'list'> >>> types.IntType <type 'int'> ``` ## 3.11\. 数组对象数组对象与列表类似，但数组只包含某些类型的简单数据。所以当数据较简单，且要求性能好的情况下，使用数组是一个好的选择。 **Table 3.5\. 数组类型代码** | 代码 | 等价的C类型 | 以字节为单位的最小尺寸 | | --- | --- | --- | | c | char | 1 | | b(B) | byte(unsigned byte) | 1 | | h(H) | short(unsigned short) | 2 | | i(I) | int(unsigned int) | 2 | | l(L) | long(unsigned long) | 4 | | f | float | 4 | | d | double | 8 | 数组创建方法如下： ``` >>> import array >>> z=array.array("b") >>> z.append(1) >>> z array('b', [1]) ``` 数组的itemsize和typecode成员可分别检索数组项的大小和数组对象的类型代码，如： ``` >>> z.itemsize 1 >>> z.typecode 'b' ``` ### 3.1\. 数组类型与其它数据类型的转换 * tolist()方法可把数组转换为列表，如： ``` >>> z.tolist() [1, 2, 3] ``` fromlist(list)方法可把列表项附加到数组的末尾，如： ``` >>> z.fromlist([10,11]) >>> z array('b', [1, 2, 3, 10, 11]) ``` > 如添加的列表类型与数组类型不同，则fromlist(list)不会把任何项添加到数组对象中。 * tostring()方法，可以把数组转换为字节的序列，如： ``` >>> z.tostring() '\x01\x02\x03\n\x0b' ``` fromstring(list)方法刚好与tostring()相反，它获取一个字节串，并把它们转换为数组的值。如： ``` >>> z.fromstring("\x0b") >>> z array('b', [1, 2, 3, 10, 11, 11]) ``` * tofile(file)方法可把数组转换为字节的序列，并把它们写入文件，如： ``` >>> f=open("aa","wb") >>> z.tofile(f) >>> f.close() ``` fromfile(file,count)方法用于从文件对象中读取特定数目的项，并把它们附加到数组中，如： ``` >>> z.fromfile(open("aa","rb"),2) >>> z array('b', [1, 2, 3, 10, 11, 11, 1, 2]) ``` 当取数项大于文件数据项时，formfile会产生EOFError异常。 * 数组对象支持列表中的很多相同函数和方法：len，append等。访问成员的方法也可列表一样，可用下标和分片。 ## Chapter 4\. 控制语句流程控制是程序设计中一个重要的内容，Python支持三种不同的控制结构：if，for和while。 * if语句判断表达式是否为真，如果为真则执行指定语句。if语句的格式如下： ``` if EXPRESSION1: STATEMENT1 elif EXPRESSION2: STATEMENT2 else: STATEMENT3 ``` 如果第一个表达式为真，则执行statement1，否则进行进一步的测试，如果第二个表达式为真则执行statement2，否则执行statement3。 > 注意语句的缩进量要保持一致。在python中没有switch和case语句，我们可通过多重elif来达到相同的效果。示例： ``` #!/usr/bin/env python mytest = raw_input("please input a number:") mytest = int(mytest) if mytest == 10: print "you input number is ten." elif mytest == 20: print "you input number is twenty." else: print "another number." ``` 脚本的执行效果： ``` t03:~# python test.py please input a number:10 you input number is ten. t03:~# python test.py please input a number:20 you input number is twenty. t03:~# python test.py please input a number:777 another number. ``` * while进行循环控制，它对表达式进行测试，如果为真，则循环执行循环体。格式如下： ``` while EXPRESSION: STATEMENT else: STATEMENT ``` 如果测试为假，则会执行else块。如果循环被中断(break)，则else块不会执行。示例： ``` >>> a = 0 >>> while a > 5: ... a = a + 1 ... print a ... else: ... print "a's value is five" ... 1 2 3 4 5 a's value is five ``` * for循环可遍历对象，并可进行迭代操作。语名格式如下： ``` for TARGET in OBJECTS： STATEMENT else: STATEMENT ``` 和while一样，在循环正常退出时，会执行else块。示例： ``` >>> mylist = "for statement" >>> for word in mylist: ... print word ... else: ... print "End list" ... f o r s t a t e m e n t End list ``` * 在循环的过程中，我们可使用循环控制语句来控制循环的执行。有三个控制语句，分别是break、continue和pass。它们的作用分别是： * break语句会立即退出当前循环，不会执行else块的内容。示例： ``` >>> mylist = ["zope","python","perl","Linux"] >>> for technic in mylist: ... if technic == "perl": ... break ... else: ... print technic ... zope python ``` * continue语句会忽略后面的语句，强制进入下一次循环。示例： ``` >>> mylist = ["zope","python","perl","Linux"] >>> for technic in mylist: ... if technic == "perl": ... continue ... else: ... print technic ... zope python Linux ``` * pass不做任何事情。示例： ``` >>> for technic in mylist: ... if technic == "perl": ... pass ... else: ... print technic ... zope python Linux ``` ## Chapter 5\. 函数函数是一个能完成特定功能的代码块，可在程序中重复使用，减少程序的代码量和提高程序的执行效率。在python中函数定义语法如下： ``` def function_name(arg1,arg2[,...]): statement [return value] ``` > 返回值不是必须的，如果没有return语句，则Python默认返回值None。函数名的命名规则： * 函数名必须以下划线或字母开头，可以包含任意字母、数字或下划线的组合。不能使用任何的标点符号； * 函数名是区分大小写的。 * 函数名不能是保留字。 Python使用名称空间的概念存储对象，这个名称空间就是对象作用的区域，不同对象存在于不同的作用域。下面是不同对象的作用域规则： * 每个模块都有自已的全局作用域。 * 函数定义的对象属局部作用域，只在函数内有效，不会影响全局作用域中的对象。 * 赋值对象属局部作用域，除非使用global关键字进行声明。 LGB规则是Python查找名字的规则，下面是LGB规则： * 大多数名字引用在三个作用域中查找：先局部(Local)，次之全局(Global)，再次之内置(Build-in)。 ``` >>> a=2 >>> b=2 >>> def test(b): ... test=a*b ... return test >>>print test(10) 20 ``` b在局部作用域中找到,a在全局作用域中找到。 * 如想在局部作用域中改变全局作用域的对象，必须使用global关键字。 ``` #没用global时的情况 >>> name="Jims" >>> def set(): ... name="ringkee" ... >>> set() >>> print name Jims #使用global后的情况 >>> name="Jims" >>> def set1(): ... global name ... name="ringkee" ... >>> set1() >>> print name ringkee ``` * 'global'声明把赋值的名字映射到一个包含它的模块的作用域中。函数的参数是函数与外部沟通的桥梁，它可接收外部传递过来的值。参数传递的规则如下： * 在一个函数中对参数名赋值不影响调用者。 ``` >>> a=1 >>> def test(a): ... a=a+1 ... print a ... >>> test(a) 2 >>> a 1 # a值不变 ``` * 在一个函数中改变一个可变的对象参数会影响调用者。 ``` >>> a=1 >>> b=[1,2] >>> def test(a,b): ... a=5 ... b[0]=4 ... print a,b ... >>> test(a,b) 5 [4, 2] >>> a 1 >>> b [4, 2] # b值已被更改 ``` 参数是对象指针，无需定义传递的对象类型。如： ``` >>> def test(a,b): ... return a+b ... >>> test(1,2) #数值型 3 >>> test("a","b") #字符型 'ab' >>> test([12],[11]) #列表 [12, 11] ``` 函数中的参数接收传递的值，参数可分默认参数，如： ``` def function(ARG=VALUE) ``` 元组（Tuples）参数： ``` def function(*ARG) ``` 字典（dictionary）参数： ``` def function(**ARG) ``` 一些函数规则： * 默认值必须在非默认参数之后； * 在单个函数定义中，只能使用一个tuple参数（\*ARG）和一个字典参数（\*\*ARG）。 * tuple参数必须在连接参数和默认参数之后。 * 字典参数必须在最后定义。 ## 5.1\. 常用函数 * abs(x) abs()返回一个数字的绝对值。如果给出复数，返回值就是该复数的模。 ``` >>>print abs(-100) 100 >>>print abs(1+2j) 2.2360679775 ``` * callable(object) callable()函数用于测试对象是否可调用，如果可以则返回1(真)；否则返回0(假)。可调用对象包括函数、方法、代码对象、类和已经定义了“调用”方法的类实例。 ``` >>> a="123" >>> print callable(a) 0 >>> print callable(chr) 1 ``` * cmp(x,y) cmp()函数比较x和y两个对象，并根据比较结果返回一个整数，如果x<y，则返回-1；如果x>y，则返回1,如果x==y则返回0。 ``` >>>a=1 >>>b=2 >>>c=2 >>> print cmp(a,b) -1 >>> print cmp(b,a) 1 >>> print cmp(b,c) 0 ``` * divmod(x,y) divmod(x,y)函数完成除法运算，返回商和余数。 ``` >>> divmod(10,3) (3, 1) >>> divmod(9,3) (3, 0) ``` * isinstance(object,class-or-type-or-tuple) -> bool 测试对象类型 ``` >>> a='isinstance test' >>> b=1234 >>> isinstance(a,str) True >>> isinstance(a,int) False >>> isinstance(b,str) False >>> isinstance(b,int) True ``` * len(object) -> integer len()函数返回字符串和序列的长度。 ``` >>> len("aa") 2 >>> len([1,2]) 2 ``` * pow(x,y[,z]) pow()函数返回以x为底，y为指数的幂。如果给出z值，该函数就计算x的y次幂值被z取模的值。 ``` >>> print pow(2,4) 16 >>> print pow(2,4,2) 0 >>> print pow(2.4,3) 13.824 ``` * range([lower,]stop[,step]) range()函数可按参数生成连续的有序整数列表。 ``` >>> range(10) [0, 1, 2, 3, 4, 5, 6, 7, 8, 9] >>> range(1,10) [1, 2, 3, 4, 5, 6, 7, 8, 9] >>> range(1,10,2) [1, 3, 5, 7, 9] ``` * round(x[,n]) round()函数返回浮点数x的四舍五入值，如给出n值，则代表舍入到小数点后的位数。 ``` >>> round(3.333) 3.0 >>> round(3) 3.0 >>> round(5.9) 6.0 ``` * type(obj) type()函数可返回对象的数据类型。 ``` >>> type(a) <type 'list'> >>> type(copy) <type 'module'> >>> type(1) <type 'int'> ``` * xrange([lower,]stop[,step]) xrange()函数与range()类似，但xrnage()并不创建列表，而是返回一个xrange对象，它的行为与列表相似，但是只在需要时才计算列表值，当列表很大时，这个特性能为我们节省内存。 ``` >>> a=xrange(10) >>> print a[0] 0 >>> print a[1] 1 >>> print a[2] 2 ``` ## 5.2\. 内置类型转换函数 * chr(i) chr()函数返回ASCII码对应的字符串。 ``` >>> print chr(65) A >>> print chr(66) B >>> print chr(65)+chr(66) AB ``` * complex(real[,imaginary]) complex()函数可把字符串或数字转换为复数。 ``` >>> complex("2+1j") (2+1j) >>> complex("2") (2+0j) >>> complex(2,1) (2+1j) >>> complex(2L,1) (2+1j) ``` * float(x) float()函数把一个数字或字符串转换成浮点数。 ``` >>> float("12") 12.0 >>> float(12L) 12.0 >>> float(12.2) 12.199999999999999 ``` * hex(x) hex()函数可把整数转换成十六进制数。 ``` >>> hex(16) '0x10' >>> hex(123) '0x7b' ``` * long(x[,base]) long()函数把数字和字符串转换成长整数，base为可选的基数。 ``` >>> long("123") 123L >>> long(11) 11L ``` * list(x) list()函数可将序列对象转换成列表。如： ``` >>> list("hello world") ['h', 'e', 'l', 'l', 'o', ' ', 'w', 'o', 'r', 'l', 'd'] >>> list((1,2,3,4)) [1, 2, 3, 4] ``` * int(x[,base]) int()函数把数字和字符串转换成一个整数，base为可选的基数。 ``` >>> int(3.3) 3 >>> int(3L) 3 >>> int("13") 13 >>> int("14",15) 19 ``` * min(x[,y,z...]) min()函数返回给定参数的最小值，参数可以为序列。 ``` >>> min(1,2,3,4) 1 >>> min((1,2,3),(2,3,4)) (1, 2, 3) ``` * max(x[,y,z...]) max()函数返回给定参数的最大值，参数可以为序列。 ``` >>> max(1,2,3,4) 4 >>> max((1,2,3),(2,3,4)) (2, 3, 4) ``` * oct(x) oct()函数可把给出的整数转换成八进制数。 ``` >>> oct(8) '010' >>> oct(123) '0173' ``` * ord(x) ord()函数返回一个字符串参数的ASCII码或Unicode值。 ``` >>> ord("a") 97 >>> ord(u"a") 97 ``` * str(obj) str()函数把对象转换成可打印字符串。 ``` >>> str("4") '4' >>> str(4) '4' >>> str(3+2j) '(3+2j)' ``` * tuple(x) tuple()函数把序列对象转换成tuple。 ``` >>> tuple("hello world") ('h', 'e', 'l', 'l', 'o', ' ', 'w', 'o', 'r', 'l', 'd') >>> tuple([1,2,3,4]) (1, 2, 3, 4) ``` ## 5.3\. 序列处理函数 * 常用函数中的len()、max()和min()同样可用于序列。 * filter(function,list) 调用filter()时，它会把一个函数应用于序列中的每个项，并返回该函数返回真值时的所有项，从而过滤掉返回假值的所有项。 ``` >>> def nobad(s): ... return s.find("bad") == -1 ... >>> s = ["bad","good","bade","we"] >>> filter(nobad,s) ['good', 'we'] ``` 这个例子通过把nobad()函数应用于s序列中所有项，过滤掉所有包含“bad”的项。 * map(function,list[,list]) map()函数把一个函数应用于序列中所有项，并返回一个列表。 ``` >>> import string >>> s=["python","zope","linux"] >>> map(string.capitalize,s) ['Python', 'Zope', 'Linux'] ``` map()还可同时应用于多个列表。如： ``` >>> import operator >>> s=[1,2,3]; t=[3,2,1] >>> map(operator.mul,s,t) # s[i]*t[j] [3, 4, 3] ``` 如果传递一个None值，而不是一个函数，则map()会把每个序列中的相应元素合并起来，并返回该元组。如： ``` >>> a=[1,2];b=[3,4];c=[5,6] >>> map(None,a,b,c) [(1, 3, 5), (2, 4, 6)] ``` * reduce(function,seq[,init]) reduce()函数获得序列中前两个项，并把它传递给提供的函数，获得结果后再取序列中的下一项，连同结果再传递给函数，以此类推，直到处理完所有项为止。 ``` >>> import operator >>> reduce(operator.mul,[2,3,4,5]) # ((2*3)*4)*5 120 >>> reduce(operator.mul,[2,3,4,5],1) # (((1*2)*3)*4)*5 120 >>> reduce(operator.mul,[2,3,4,5],2) # (((2*2)*3)*4)*5 240 ``` * zip(seq[,seq,...]) zip()函数可把两个或多个序列中的相应项合并在一起，并以元组的格式返回它们，在处理完最短序列中的所有项后就停止。 ``` >>> zip([1,2,3],[4,5],[7,8,9]) [(1, 4, 7), (2, 5, 8)] ``` 如果参数是一个序列，则zip()会以一元组的格式返回每个项，如： ``` >>> zip((1,2,3,4,5)) [(1,), (2,), (3,), (4,), (5,)] >>> zip([1,2,3,4,5]) [(1,), (2,), (3,), (4,), (5,)] ``` ## Chapter 6\. 模块模块可把一个复杂的程序按功能分开，分别存放到不同文件中，使程序更容易维护和管理。在Python中的模块是一个以.py结尾的Python代码文件。可通过import命令输入，如： ``` import sys ``` import会完成以下三个操作： * 创建新的名称空间（namespace），该名称空间中拥有输入模块中定义的所有对象； * 执行模块中的代码； * 创建该名称空间的变量名。 import语句可同时输入多个模块，如： ``` import os,sys,system ``` 也可写成： ``` import os import sys import system ``` 有些模块的名称很长，我们可在输入时给它起个简单的别名，这样在使用模块中的对象就方便很多，如： ``` import ftplib as ftp ``` 有时我们可能只想使用模块中某个对象，又不想把整个模块输入，则可以用from...import语句输入特定对象。如： ``` from ftplib import FTP ``` 这样，我们就可直接使用FTP()，而不用带前缀。如果装载模块出错，会引发ImportError异常。我们可捕获该异常进行相应处理。 Python脚本和模块都是一个以.py结束的文件，那程序是如何判断一个.py文件是作为脚本还是模块呢？关键是一个名为\_\_name\_\_的变量，如果它的值是\_\_main\_\_，则不能作为模块，只能作为脚本直接运行。所以在很多脚本的最后都有一段类似下面的语句，限制只能以脚本方式运行，不作为模块： ``` if __name__ == '__main__': main() ``` 几个功能相近的模块我们可组成一个Python包，存放到一个目录结构中，通过输入包的路径来调用对象。要定义包，就要建一个与包名同名的目录，接着在该目录下创建\_\_init\_\_.py文件。该文件是包的初始化文件，可以为空，也可定义一个代码。例如一个WebDesign包的目录如下： ``` /WebDesign __init_.py design.py draw.py ... ``` 我们可通过以下语句输入design模块： ``` import WebDesign.design ``` ## 6.1\. String模块 * replace(string,old,new[,maxsplit]) 字符串的替换函数，把字符串中的old替换成new。默认是把string中所有的old值替换成new值，如果给出maxsplit值，还可控制替换的个数，如果maxsplit为1，则只替换第一个old值。 ``` >>>a="11223344" >>>print string.replace(a,"1","one") oneone2223344 >>>print string.replace(a,"1","one",1) one12223344 ``` * capitalize(string) 该函数可把字符串的首个字符替换成大字。 ``` >>> import string >>> print string.capitalize("python") Python ``` * split(string,sep=None,maxsplit=-1) 从string字符串中返回一个列表，以sep的值为分界符。 ``` >>> import string >>> ip="192.168.3.3" >>> ip_list=string.split(ip,'.') >>> print ip_list ['192', '168', '3', '3'] ``` * join(string[,sep]) 返回用sep连接的字串，默认的sep是空格。 ``` >>> import string >>> a = ['a','b','c'] >>> b = string.join(a,'-') >>> b 'a-b-c' >>> a ['a', 'b', 'c'] ``` ## 6.2\. time模块内置模块time包含很多与时间相关函数。我们可通过它获得当前的时间和格式化时间输出。 * time()，以浮点形式返回自Linux新世纪以来经过的秒数。在linux中，00:00:00 UTC, January 1, 1970是新纪元的开始。 ``` >>> time.time() 1150269086.6630149 >>> time.ctime(1150269086.6630149) >>> 'Wed Jun 14 15:11:26 2006' ``` * ctime([sec])，把秒数转换成日期格式，如果不带参数，则显示当前的时间。 ``` >>> import time >>> time.ctime() >>> 'Wed Jun 14 15:02:50 2006' >>> time.ctime(1138068452427683) 'Sat Dec 14 04:51:44 1901' ``` * sleep(secs)，定时。 ``` >>> time.sleep(10) >>> #10秒后才会出现>>>提示符 ``` ## Chapter 7\. 类类是面向对象编程的一个重要概念。通过类的创建和继承，可重用代码，减少代码复杂度。Python是一种面向对象的脚本语言，用class语句可创建类，语法规则如下： ``` class classnmae([class_parent,...]): ... def method(): ... ... ``` 一个例子： ``` #!/usr/bin/python #-*- encoding:utf-8 -*- class test: #定义一个test类 desc = "这是一个测试类。" #在类中定义一个属性desc def __init__(self,name1): #对象构造函数，初始化类 self.name1 = name1 def show(self,name2): #在类中定义一个方法show() print "hello world" print 'name1:',self.name1 print 'name2:',name2 instance = test('这是传递给name1的值') #生成test类的实例对象instance print instance.desc #调用类中的desc属性 instance.show('这是传递给name2的值') #调用类中的show()方法 ``` 把该脚本命名为test.py，并用chmod +x test.py使脚本有执行的权限，运行该脚本结果如下： ``` debian:~/python# ./test.py 这是一个测试类。 hello world name1: 这是传递给name1的值 name2: 这是传递给name2的值 ``` 这里只是Python语言中类的一个简单介绍。详细介绍可参考网站上自由文档栏目中的Python资料。 ## Chapter 8\. 异常处理 Python的异常处理能力是很强大的，可向用户准确反馈出错信息。在Python中，异常也是对象，可对它进行操作。所有异常都是基类Exception的成员。异常处理的try语法有两种，一种是： ``` try: block except [exception,[data...]]: block else: block ``` 该种异常处理语法的规则是： * 执行try下的语句，如果引发异常，则执行过程会跳到第一个except语句。 * 如果第一个except中定义的异常与引发的异常匹配，则执行该except中的语句。 * 如果引发的异常不匹配第一个except，则会搜索第二个except，允许编写的except数量没有限制。 * 如果所有的except都不匹配，则异常会传递到下一个调用本代码的最高层try代码中。 * 如果没有发生异常，则执行else块代码。 try语句的第二种语法是： ``` try: block finally: block ``` 该语句的执行规则是： * 执行try下的代码。 * 如果发生异常，在该异常传递到下一级try时，执行finally中的代码。 * 如果没有发生异常，则执行finally中的代码。第二种try语法在无论有没有发生异常都要执行代码的情况下是很有用的。例如我们在python中打开一个文件进行读写操作，我在操作过程中不管是否出现异常，最终我都是要把该文件关闭的。除了系统引发的异常外，我们还可用raise语句手工引发一个异常： ``` raise [exception[,data]] ``` ## Chapter 9\. 文件处理文件是我们储存信息的地方，我们经常要对文件进行读、写、删除等的操作，在Python中，我们可用Python提供的函数和方法方便地操作文件。 ## 9.1\. 文件处理的函数和方法使用Open()函数可打开文件，语法格式如下： ``` file_handler = open(filename,[,mode[,bufsize]] ``` filename是你要操作的文件名，如果不在当前路径，需指出具体路径。mode是打开文件的模式，表示你要如何操作文件，bufsize表示是否使用缓存。 **Table 9.1\. mode** | 模式 | 描述 | | --- | --- | | r | 以读方式打开文件，可读取文件信息。 | | w | 以写方式打开文件，可向文件写入信息。 | | a | 以追加方式打开文件，文件指针自动移到文件尾。 | | r+ | 以读写方式打开文件，可对文件进行读和写操作。 | | w+ | 消除文件内容，然后以读写方式打开文件。 | | a+ | 以读写方式打开文件，并把文件指针移到文件尾。 | | b | 以二进制模式打开文件，而不是以文本模式。该模式只对Windows或Dos有效，类Unix的文件是用二进制模式进行操作的。 | **Table 9.2\. bufsize** | bufsize取值 | 描述 | | --- | --- | | 0 | 禁用缓冲 | | 1 | 行缓冲 | | >1 | 指定缓冲区的大小 | | <1 | 系统默认的缓冲区大小 | open()函数返回一个文件对象，我们可通过read()或write()函数对文件进行读写操作，下面是一些文件对象方法： **Table 9.3\. 文件对象方法** | 方法 | 描述 | | --- | --- | | f.close() | 关闭文件，记住用open()打开文件后一定要记得关闭它，否则会占用系统的可打开文件句柄数。 | | f.fileno() | 获得文件描述符 | | f.flush() | 刷新输出缓存 | | f.isatty() | 如果文件是一个交互终端，则返回True，否则返回False。 | | f.read([count]) | 读出文件，如果有count，则读出count个字节。 | | f.readline() | 读出一行信息。 | | f.readlines() | 读出所有行，也就是读出整个文件的信息。 | | f.seek(offset[,where]) | 把文件指针移动到相对于where的offset位置。offset为0表示文件开始处，这是默认值；1表示当前位置；2表示文件结尾。 | | f.tell() | 获得文件指针位置。 | | f.truncate([size]) | 截取文件，使文件的大小为size。 | | f.write(string) | 把string字符串写入文件。 | | f.writelines(list) | 把list中的字符串一行一行地写入文件。 | ## 9.2\. 示例 * 文件的打开或创建 ``` #!/usr/bin/env python #-*- encoding:UTF-8 -*- filehandler = open('test.txt','w') #以写模式打开文件，如果文件不存在则创建 filehandler.write('this is a file open/create test.\nthe second line.') filehandler.close() ``` ``` #!/usr/bin/env python #-*- encoding:UTF-8 -*- filehandler = open('test.txt','a') #以追加模式打开文件，如果文件不存在则创建 filehandler.write('\nappend the text in another line.\n') filehandler.close() ``` * 读取文件 ``` #!/usr/bin/env python #-*- encoding:UTF-8 -*- filehandler = open('test.txt','r') #以读方式打开文件，rb为二进制方式(如图片或可执行文件等) print 'read() function:' #读取整个文件 print filehandler.read() print 'readline() function:' #返回文件头，读取一行 filehandler.seek(0) print filehandler.readline() print 'readlines() function:' #返回文件头，返回所有行的列表 filehandler.seek(0) print filehandler.readlines() print 'list all lines' #返回文件头，显示所有行 filehandler.seek(0) textlist = filehandler.readlines() for line in textlist: print line print 'seek() function' #移位到第32个字符，从33个字符开始显示余下内容 filehandler.seek(32) print filehandler.read() print 'tell() function' #移位到文件头，从头开始显示2位字符 filehandler.seek(0) print filehandler.readline() #显示第一行内容 print filehandler.tell() #显示当前位置 print filehandler.readline() #显示第二行内容 print filehandler.read() #显示余下所有内容 filehandler.close() #关闭文件句柄 ``` * 文件系统操作 ``` #!/usr/bin/env python #-*- encoding:utf-8 -*- import os,fnmatch,glob for fileName in os.listdir ( '/root' ): #列出/root目录内容，不包括.和.. print fileName os.mkdir('py') #在当前目录下创建一个py目录，且只能创建一层 os.rmdir( 'py') #在当前目录下删除py目录，且只能删除一层 os.makedirs('py/aa') #可创建多层目录 os.removedirs('py/aa') #可删除多层目录 print 'demonstration fnmatch module' for fileName in os.listdir ( '/root/python/file' ): if fnmatch.fnmatch(fileName,'*.txt'): #利用UNIX风格的通配，只显示后缀为txt的文件 print fileName print 'demonstration glob module' for fileName in glob.glob ( '*.txt' ): #利用UNIX风格的通配，只显示后缀为txt的文件 print fileName ``` * 获取文件状态 ``` #!/usr/bin/env python #-*- encoding:UTF-8 -*- import os,time,stat fileStats = os.stat ( 'test.txt' ) #获取文件/目录的状态 fileInfo = { 'Size':fileStats [ stat.ST_SIZE ], #获取文件大小 'LastModified':time.ctime( fileStats [ stat.ST_MTIME ] ), #获取文件最后修改时间 'LastAccessed':time.ctime( fileStats [ stat.ST_ATIME ] ), #获取文件最后访问时间 'CreationTime':time.ctime( fileStats [ stat.ST_CTIME ] ), #获取文件创建时间 'Mode':fileStats [ stat.ST_MODE ] #获取文件的模式 } #print fileInfo for field in fileInfo: #显示对象内容 print '%s:%s' % (field,fileInfo[field]) #for infoField,infoValue in fileInfo: # print '%s:%s' % (infoField,infoValue) if stat.S_ISDIR ( fileStats [ stat.ST_MODE ] ): #判断是否路径 print 'Directory. ' else: print 'Non-directory.' if stat.S_ISREG ( fileStats [ stat.ST_MODE ] ): #判断是否一般文件 print 'Regular file.' elif stat.S_ISLNK ( fileStats [ stat.ST_MODe ] ): #判断是否链接文件 print 'Shortcut.' elif stat.S_ISSOCK ( fileStats [ stat.ST_MODe ] ): #判断是否套接字文件 print 'Socket.' elif stat.S_ISFIFO ( fileStats [ stat.ST_MODe ] ): #判断是否命名管道 print 'Named pipe.' elif stat.S_ISBLK ( fileStats [ stat.ST_MODe ] ): #判断是否块设备 print 'Block special device.' elif stat.S_ISCHR ( fileStats [ stat.ST_MODe ] ): #判断是否字符设置 print 'Character special device.' ``` ``` #!/usr/bin/env python #-*- encoding:UTF-8 -*- import os.path fileStats = 'test.txt' if os.path.isdir ( fileStats ): #判断是否路径 print 'Directory.' elif os.path.isfile ( fileStats ): #判断是否一般文件 print 'File.' elif os.path.islink ( fileStats ): #判断是否链接文件 print 'Shortcut.' elif os.path.ismount ( fileStats ): #判断是否挂接点 print 'Mount point.' ``` stat模块描述了os.stat(filename)返回的文件属性列表中各值的意义。我们可方便地根据stat模块存取os.stat()中的值。 * 串行化文件 ``` #!/usr/bin/env python #-*- encoding:UTF-8 -*- import pickle filehandler = open('pickle.txt','w') text = ['this is a pickle demonstrate','aa','bb'] pickle.dump(text,filehandler) #把text的内容序列化后保存到pickle.txt文件中 filehandler.close() filehandler2 = open('pickle.txt') textlist = pickle.load(filehandler2) #还原序列化字符串 print textlist filehandler2.close() #cpickle是用C写的pickle模块，比标准的pickle速度快很多，使用方法同pickle。 ``` * 内存文件 ``` #!/usr/bin/env python #-*- coding: utf-8 -*- import StringIO fileHandle = StringIO.StringIO ( "Let freedom ring." ) #create file in memory print fileHandle.read() # "Let freedom ring." fileHandle.close() #cStringIO是用C写的StringIO模块，执行速度比StringIO快。 ``` shutil模块是一个高级的文件处理模块，可实现文件的拷贝、删除等操作。 ## Chapter 10\. 正则表达式正则表达式是一个很有用的工具，可处理复杂的字符匹配和替换工作。在Python中内置了一个re模块以支持正则表达式。正则表达式有两种基本的操作，分别是匹配和替换。 * 匹配就是在一个文本字符串中搜索匹配一特殊表达式； * 替换就是在一个字符串中查找并替换匹配一特殊表达式的字符串。 ## 10.1\. 基本元素正则表达式定义了一系列的特殊字符元素以执行匹配动作。 **Table 10.1\. 正则表达式基本字符** | 字符 | 描述 | | --- | --- | | text | 匹配text字符串 | | . | 匹配除换行符之外的任意一个单个字符 | | ^ | 匹配一个字符串的开头 | | $ | 匹配一个字符串的末尾 | 在正则表达式中，我们还可用匹配限定符来约束匹配的次数。 **Table 10.2\. 匹配限定符** | 最大匹配 | 最小匹配 | 描述 | | --- | --- | --- | | * | * | 重复匹配前表达式零次或多次 | | + | + | 重复匹配前表达式一次或多次 | | ? | ? | 重复匹配前表达式零次或一次 | | {m} | {m} | 精确重复匹配前表达式m次 | | {m,} | {m,} | 至少重复匹配前表达式m次 | | {m,n} | {m,n} | 至少重复匹配前表达式m次，至多重复匹配前表达式n次 | 据上所述，".\*"为最大匹配，能匹配源字符串所有能匹配的字符串。".\* "为最小匹配，只匹配第一次出现的字符串。如：d.\*g能匹配任意以d开头，以g结尾的字符串，如"debug"和"debugging"，甚至"dog is walking"。而d.\* g只能匹配"debug"，在"dog is walking"字符串中，则只匹配到"dog "。在一些更复杂的匹配中，我们可用到组和运算符。 **Table 10.3\. 组和运算符** | 组 | 描述 | | --- | --- | | [...] | 匹配集合内的字符，如[a-z],[1-9]或[,./;'] | | [^...] | 匹配除集合外的所有字符，相当于取反操作 | | A|B | 匹配表达式A或B，相当于OR操作 | | (...) | 表达式分组，每对括号为一组，如([a-b]+)([A-Z]+)([1-9]+) | | \number | 匹配在number表达式组内的文本 | 有一组特殊的字符序列，用来匹配具体的字符类型或字符环境。如\b匹配字符边界，food\b匹配"food"、"zoofood"，而和"foodies"不匹配。 **Table 10.4\. 特殊字符序列** | 字符 | 描述 | | --- | --- | | \A | 只匹配字符串的开始 | | \b | 匹配一个单词边界 | | \B | 匹配一个单词的非边界 | | \d | 匹配任意十进制数字字符，等价于r'[0-9]' | | \D | 匹配任意非十进制数字字符，等价于r'[^0-9]' | | \s | 匹配任意空格字符（空格符、tab制表符、换行符、回车、换页符、垂直线符号） | | \S | 匹配任意非空格字符 | | \w | 匹配任意字母数字字符 | | \W | 匹配任意非字母数字字符 | | \Z | 仅匹配字符串的尾部 | | \\ | 匹配反斜线字符 | 有一套声明(assertion)对具体事件进行声明。 **Table 10.5\. 正则表达式声明** | 声明 | 描述 | | --- | --- | | ( iLmsux) | 匹配空字符串，iLmsux字符对应下表的正则表达式修饰符。 | | ( :...) | 匹配圆括号内定义的表达式，但不填充字符组表。 | | ( P<name>) | 匹配圆括号内定义的表达式，但匹配的表达式还可用作name标识的符号组。 | | ( P=name) | 匹配所有与前面命名的字符组相匹配的文本。 | | ( #...) | 引入注释，忽略圆括号内的内容。 | | ( =...) | 如果所提供的文本与下一个正则表达式元素匹配，这之间没有多余的文本就匹配。这允许在一个表达式中进行超前操作，而不影响正则表达式其余部分的分析。如"Martin"其后紧跟"Brown"，则"Martin( =Brown)"就只与"Martin"匹配。 | | ( !...) | 仅当指定表达式与下一个正则表达式元素不匹配时匹配，是( =...)的反操作。 | | ( <=...) | 如果字符串当前位置的前缀字符串是给定文本，就匹配，整个表达式就在当前位置终止。如( <=abc)def表达式与"abcdef"匹配。这种匹配是对前缀字符数量的精确匹配。 | | ( <!...) | 如果字符串当前位置的前缀字符串不是给定的正文，就匹配，是( <=...)的反操作。 | 正则表达式还支持一些处理标志，它会影响正则式的执行方法。 **Table 10.6\. 处理标志** | 标志 | 描述 | | --- | --- | | I或IGNORECASE | 忽略表达式的大小写来匹配文本。 | ## 10.2\. 操作通过re模块，我们就可在python中利用正则式对字符串进行搜索、抽取和替换操作。如：re.search()函数能执行一个基本的搜索操作，它能返回一个MatchObject对象。re.findall()函数能返回匹配列表。 ``` >>> import re >>> a="this is my re module test" >>> obj = re.search(r'.*is',a) >>> print obj <_sre.SRE_Match object at 0xb7d7a218> >>> obj.group() 'this is' >>> re.findall(r'.*is',a) ['this is'] ``` MatchObject对象方法 **Table 10.7\. MatchObject对象方法** | 方法 | 描述 | | --- | --- | | expand(template) | 展开模板中用反斜线定义的内容。 | | m.group([group,...]) | 返回匹配的文本，是个元组。此文本是与给定group或由其索引数字定义的组匹配的文本，如果没有组定组名，则返回所有匹配项。 | | m.groups([default]) | 返回一个元组，该元组包含模式中与所有组匹配的文本。如果给出default参数，default参数值就是与给定表达式不匹配的组的返回值。default参数的默认取值为None。 | | m.groupdict([default]) | 返回一个字典，该字典包含匹配的所有子组。如果给出default参数，其值就是那些不匹配组的返回值。default参数的默认取值为None。 | | m.start([group]) | 返回指定group的开始位置，或返回全部匹配的开始位置。 | | m.end([group]) | 返回指定group的结束位置，或返回全部匹配的结束位置。 | | m.span([group]) | 返回两元素组，此元组等价于关于一给定组或一个完整匹配表达式的(m.start(group),m.end(group)))列表 | | m.pos | 传递给match()或search()函数的pos值。 | | m.endpos | 传递给match()或search()函数的endpos值。 | | m.lastindex | | m.lastgroup | | m.re | 创建这个MatchObject对象的正则式对象 | | m.string | 提供给match()或search()函数的字符串。 | 使用sub()或subn()函数可在字符串上执行替换操作。sub()函数的基本格式如下： ``` sub(pattern,replace,string[,count]) ``` 示例 ``` >>> str = 'The dog on my bed' >>> rep = re.sub('dog','cat',str) >>> print rep The cat on my bed ``` replace参数可接受函数。要获得替换的次数，可使用subn()函数。subn()函数返回一个元组，此元组包含替换了的文本和替换的次数。如果需用同一个正则式进行多次匹配操作，我们可把正则式编译成内部语言，提高处理速度。编译正则式用compile()函数来实现。compile()函数的基本格式如下： ``` compile(str[,flags]) ``` str表示需编译的正则式串，flags是修饰标志符。正则式被编译后生成一个对象，该对象有多种方法和属性。 **Table 10.8\. 正则式对象方法/属性** | 方法/属性 | 描述 | | --- | --- | | r.search(string[,pos[,endpos]]) | 同search()函数，但此函数允许指定搜索的起点和终点 | | r.match(string[,pos[,endpos]]) | 同match()函数，但此函数允许指定搜索的起点和终点 | | r.split(string[,max]) | 同split()函数 | | r.findall(string) | 同findall()函数 | | r.sub(replace,string[,count]) | 同sub()函数 | | r.subn(replace,string[,count]) | 同subn()函数 | | r.flags | 创建对象时定义的标志 | | r.groupindex | 将r'( Pid)'定义的符号组名字映射为组序号的字典 | | r.pattern | 在创建对象时使用的模式 | 转义字符串用re.escape()函数。通过getattr获取对象引用 ``` >>> li=['a','b'] >>> getattr(li,'append') >>> getattr(li,'append')('c') #相当于li.append('c') >>> li ['a', 'b', 'c'] >>> handler=getattr(li,'append',None) >>> handler <built-in method append of list object at 0xb7d4a52c> >>> handler('cc') #相当于li.append('cc') >>> li ['a','b','c','cc'] >>>result = handler('bb') >>>li ['a','b','c','cc','bb'] >>>print result None ``` ## Chapter 11\. 调试 Python自带了一个调试器叫pdb，和Gnu的gbd类似。下面用一个简单的程序来演示pdb的功能。程序代码如下： ``` #!/usr/bin/python import pdb a = "aaa" pdb.set_trace() b = "bbb" c = "ccc" final = a + b + c print final ``` 该程序已导入pdb模块，并在代码中添加的pdb.set_trace()跟踪点。现在让我们来运行该程序。 ``` localhost:~/python/pdb# python pdbtest.py --Return-- > /usr/lib/python2.3/pdb.py(992)set_trace()->None -> Pdb().set_trace() # 从跟踪点开始执行 (Pdb) n # n 读入下一行代码 > /root/python/pdb/pdbtest.py(6) () -> b = "bbb" (Pdb) n > /root/python/pdb/pdbtest.py(7) () -> c = "ccc" (Pdb) p b # p 打印变量值 'bbb' (Pdb) l # l 显示当前执行位置 2 3 import pdb 4 a = "aaa" 5 pdb.set_trace() 6 b = "bbb" 7 -> c = "ccc" 8 final = a + b + c 9 print final 10 [EOF] (Pdb) n > /root/python/pdb/pdbtest.py(8) () -> final = a + b + c (Pdb) n # 如果命令和上次的一样，也可直接按回车，不用输入'n' > /root/python/pdb/pdbtest.py(9) () -> print final (Pdb) n aaabbbccc --Return-- > /root/python/pdb/pdbtest.py(9) ()->None -> print final (Pdb) p a,b,c,final ('aaa', 'bbb', 'ccc', 'aaabbbccc') (Pdb) ('aaa', 'bbb', 'ccc', 'aaabbbccc') (Pdb) n localhost:~/python/pdb# # 返回shell ``` pdb还有很多命令，用help命令就可以列出所有的pdb命令，用help p可以查询p命令的说明。 ## Chapter 12\. HOW-TO 本章内容记录Python的一些小技巧小知识。来源是网上摘录或自己学习所得。 * 如何判断操作系统类型 ``` import sys print sys.platform print sys.version ``` * 显示和修改python的Module搜索路径 ``` >>> import sys >>> print sys.path ['', '/usr/lib/python23.zip', '/usr/lib/python2.3', '/usr/lib/python2.3/plat-linux2', '/usr/lib/python2.3/lib-tk', '/usr/lib/python2.3/lib-dynload', '/usr/local/lib/python2.3/site-packages', '/usr/lib/python2.3/site-packages'] >>> sys.path.append('/usr/lib/mypath') >>> print sys.path ['', '/usr/lib/python23.zip', '/usr/lib/python2.3', '/usr/lib/python2.3/plat-linux2', '/usr/lib/python2.3/lib-tk', '/usr/lib/python2.3/lib-dynload', '/usr/local/lib/python2.3/site-packages', '/usr/lib/python2.3/site-packages', '/usr/lib/mypath'] ``` * 把列表转换成字符串 ``` >>> t=['a','b','c'] >>> print t ['a', 'b', 'c'] >>> import string >>> print string.join(t) a b c ``` * 运行系统程序 ``` >>>import os >>>os.system('ls') #用os.system()可执行系统命令 >>>exec "os.system('ls')" #用exec可执行字符串中的命令，两个命令的效果一样。 ``` 以上两个命令的输出都是直接显示在屏幕上，不能保存到变量中，如果我们要把输出保存起来，可用os.pope\ n()函数。 ``` >>>cmd = '/usr/bin/mkntpwd %s' % password >>>handler = os.popen(cmd,'r') >>>passwordString=handler.read() #passwordString为mkntpwd程序的输出结果 ``` 使用commands模块也可以获取程序的输出，它包含一些基于os.popen()的封装函数，使我们能更方便地获取运行系统命令和获取命令的输出，但该模块只在Unix系统下有效，不能用于Windows平台。 ``` >>> import commands >>> status,output = commands.getstatusoutput('ls -l') >>> print output 总计 96564 -rw-r--r-- 1 root root 4459 2005-12-01 10:23 2005.sxw -rw-r--r-- 1 root root 27511 2006-04-12 16:54 20060412_user.ods -rw-r--r-- 1 root root 202258 2006-01-06 16:48 2006风景-1月.jpg ... >>> print status 0 ``` 在Python2.4中引入一个新的模块叫subprocess，用于取代os.system、os.spawn\*、os.popen\*、popen2.\*、commands.\*。 * 编码转换 ``` #!/usr/bin/python #-*-coding:utf-8 -*- a=u"测试" b=a.encode('gb2312') print a print b ``` * 交换两个变量 ``` >>> a,b = 1,2 >>> a,b (1, 2) >>> a,b = b,a >>> a,b (2, 1) >>> a 2 >>> b 1 ``` * 测试数据类型 ``` >>> a=123 >>> b='test' >>> a 123 >>> b 'test' >>> isinstance(a,int) True >>> isinstance(a,str) False >>> isinstance(b,int) False >>> isinstance(b,str) True ``` * 用in判断是否包含子字符串 ``` >>> a='this is my test' >>> 'is' in a True >>> 'mm' in a False ``` * \_\_iter\_\_迭代器 ``` >>> a = "iterator" >>> t = iter(a) >>> t.next() 'i' >>> t.next() 't' >>> t.next() 'e' >>> t.next() 'r' >>> t.next() 'a' >>> t.next() 't' >>> t.next() 'o' >>> t.next() 'r' >>> t.next() Traceback (most recent call last): File "<stdin>", line 1, in StopIteration ``` 自已写一个迭代器类 ``` >>> class reverse: ... def __init__(self,data): ... self.data=data ... self.index=len(data) ... def __iter__(self): ... return self ... def next(self): ... if self.index == 0: ... raise StopIteration ... self.index = self.index - 1 ... return self.data[self.index] ... >>> for char in reverse('iterator'): ... print char ... r o t a r e t i >>> ``` * 通过getattr可以得到一个在运行时才知道具体函数名的对象的引用，能增强我们程序的灵活性。 ``` >>> li=['a','b'] >>> getattr(li,'append') >>> getattr(li,'append')('c') #相当于li.append('c') >>> li ['a', 'b', 'c'] >>> handler=getattr(li,'append',None) >>> handler <built-in method append of list object at 0xb7d4a52c> >>> handler('cc') #相当于li.append('cc') >>> li ['a','b','c','cc'] >>>result = handler('bb') >>>li ['a','b','c','cc','bb'] >>>print result None ``` 编程示例： ``` import statsout def output(data, format="text"): output_function = getattr(statsout, "output_%s" % format) return output_function(data) ``` 以上代码表示，output函数接收一个data参数和format参数，根据format参数的值，从statsout模块中取出output_text函数运行，data参数通过output_function(data)传递给了statsout模块中的output_text函数。format取不同值可从statsout模块中取出不同的函数运行（output_xxxx）。也就是说我们要运行的函数是在程序运行后才确定的。这样我们可把不同的函数以output_xxx形式命名放在statout模块中，通过以上程序可动态调用各种函数。 * hasattr用于确定一个对象是否具有某个属性。语法： ``` hasattr(object, name) -> bool ``` 判断object中是否有name属性，返回一个布尔值。 * 拆分序列 ``` >>> a=[c for c in 'abcdefg'] >>> a ['a', 'b', 'c', 'd', 'e', 'f', 'g'] >>> ``` 按if条件拆分序列 ``` >>> a=[c for c in '123456' if int(c)<3] 如果if的条件为真，则执行for循环 >>> a ['1', '2'] >>> a=[c for c in '123456' if int(c)>3] 如果if的条件为假，则不执行for循环 >>> a ['4', '5', '6'] ``` * \_\_dict\_\_记录模块或类中所有对象的信息，它以字典{name:object}的形式记录这些信息，如果wikiaction是一个模块，则可以这样显示： ``` >>>import wikiaction >>>print wikiaction.__dict__ {'do_test': <function do_test at 0xb7c10534>, 'do_diff': <function do_diff at 0xb7c0ef0c>, 'do_refresh': <fun ction do_refresh at 0xb7c1025c>, 'do_userform': <function do_userform at 0xb7c103e4>, 'getHandler': <function getHandler at 0xb7c105a4>, 'do_raw': <function do_raw at 0xb7c10454>, 'do_chart': <function do_chart at 0xb7 c104c4>, 're': <module 're' from '/usr/lib/python2.3/re.pyc'>, 'pysupport': <module 'MoinMoin.util.pysupport' from '/usr/lib/python2.3/site-packages/MoinMoin/util/pysupport.pyc'>, 'config': <module 'MoinMoin.config' fr om '/usr/lib/python2.3/site-packages/MoinMoin/config.pyc'>} ``` * 'and'的特殊用法 ``` >>> 'a' and 'b' #如果两个都为真值，返回最后一个真值 'b' >>> 'b' and 'a' #同上 'a' >>> 'a' and 'b' and 'c' #同上 'c' >>> '' and 'a' #如果有假值，则返回假值 '' >>> 'a' and '' and 'c' #同上 '' >>> '' and 0 #如果两个都为假值，返回第一个假值 '' >>> 0 and '' #同上 0 ``` * 'or'的的特殊用法 ``` >>> 'a' or 'b' #如果有一个为真值，则返回第一个真值 'a' >>> 'b' or 'a' #同上 'b' >>> 'a' or 'b' or '' #同上 'a' >>> 0 and '' and {} #如果所有都是假值，则返回第一个假值 0 >>> {} and '' and {} #同上 {} ``` * lambda匿名函数的用法 ``` >>> a=lambda c:c*2 >>> a <function <lambda> at 0xb7dd710c> >>> a(2) 4 >>> a(5) 10 ```