what's new in python 3.0 · 一入python深似海

官方英文文档：[https://docs.python.org/3/whatsnew/3.0.html](https://docs.python.org/3/whatsnew/3.0.html) 中文翻译版转载地址:[http://www.kankanews.com/ICkengine/archives/70301.shtml](http://www.kankanews.com/ICkengine/archives/70301.shtml) 这篇文章总结了一些与Python2.6相比Python3.0中的新特性.Python3是一个不向后兼容的版本，有了很多的改变，这些对于Python开发者来说是非常重要的，虽然多数人说Python3真正流行起来还需要一段时间，但是Python3确实有了很大的改进，现在也是时间来学习Python3了。在真正理解Python3中的一些变化之后，会发现其实Python3的变化并没有想象的那么多，主要是修复了一些令人讨厌的地方。一般在每一个发行版源码的Misc/NEWS文件中详细描述了每一个细小的变化。 ### 1、常见的障碍 #### 1.1 Print是一个函数在Python3中print是个函数，这意味着在使用的时候必须带上小括号,并且它是带有参数的。 ~~~ old: print "The answer is", 2+2 new: print("The answer is", 2+2) old: print x, # 末尾加上逗号阻止换行 new: print(x, end="") # 使用空格来代替新的一行 old: print >>sys.staerr, "fatal error" new: print ("fatal error", file=sys.stderr) old: print (x, y) # 打印出元组(x, y) new: print((x, y)) # 同上,在python3中print(x, y)的结果是跟这不同的 ~~~ 在Python3中还可以定义分隔符，使用参数sep来指定. ~~~ print("There are <", 2+5, ">possibilities", sep="") ~~~ 上面代码的结果如下: ~~~ There are <7> possibilities ~~~ 注意: - print()函数不支持Python2.X中print中的“软空格”。在Python2.X中,print “A\n”, “B”的结果是”A\nB\n”;而在Python3中print(“A\n”, “B”)的结果是”A\n B\n”。 - 在刚开始使用Python3的时候,你会发现你经常在交互模式下你还是经常使用老式的语法print x,是时候锻炼你的手指用print(x)来取代它啦。 - 如果你的项目比较大,而又想升级到Python3的时候,不用担心,2to3这个工具会将所有的print语句转换为print()函数。 #### 1.2 使用Views和Iterators代替Lists - dict的方法dict.keys(),dict.items(),dict.values()不会再返回列表,而是返回一个易读的“views”。这样一来，像这样的语法将不再有用了:k = d.keys();k.sort(),你可以使用k = sorted(d)来代替。sorted(d)在Python2.5及以后的版本中也有用，但是Python3效率更高了。 ~~~ d = {'a': 1} d.keys() # dict_keys(['a']) d.items() # dict_items([('a', 1)]) d.values() # dict_values([1]) k = d.keys(); k.sort() # AttributeError: 'dict_keys' object has no attribute 'sort' ~~~ - 同样，dict.iterkeys(),dict.iteritems(),dict.itervalues()方法也不再支持。 - map()和filter()将返回iterators。如果你真的想要得到列表,list(map(…))是一个快速的方法，但是更好的方法是使用列表推导(尤其是原代码使用了lambda表达式的时候),或者重写原来的代码,改为不需要使用列表。特别是map()会给函数带来副作用，正确的方法是改为使用for循环，因为创建一个列表是非常浪费的事情。 - Python3中的range()函数跟Python2.X的xrange()函数的作用是一样的，这样可以使用任意的数字,Python3中去除了xrange()函数。 - zip()在Python3中返回的是一个迭代器。 #### 1.3 比较符 Python3简化了比较符。 - 在使用比较符(<,<=,>=,>)时，当相比较的操作数的排序是没有意义的时候将会抛出TypeError异常,因此像1 < ”,0 > None,len <= len这样的语句不再合法了。None < None也会抛出TypeError异常，而不是返回False。你应该明白了,胡乱的比较是没有意义的,相比较的元素必须是能够比较的才行。需要注意的是,==和!=不包括在内,因为不通类型的,无法比较元素总是不等于另一个的。 - builtin.sorted和list.sort()不再有提供比较函数的cmp参数,只有参数key和reverse。 - cmp()函数应该当做被去除了,__cmp__()特殊方法也不再支持。在需要的时候使用__lt__,__eg__和__hash__。 #### 1.4 整型数 - 从本质上来说,long重命名了int,因为在内置只有一个名为int的整型,但它基本跟之前的long一样。 - 像1/2这样的语句将返回float，即0.5。使用1//2来获取整型,这也是之前版本所谓的“地板除”。 - 移除了sys.maxint,因为整型数已经没了限制。sys.maxsize可以用来当做一个比任何列表和字符串下标都要大的整型数。 - repr()中比较大的整型数将不再带有L后缀。 - 八进制数的字面量使用0o720代替了0720。 #### 1.5 Text Vs. Data 代替 Unicode Vs. 8-bit Python3中改变了二进制数据和Unicode字符串。 - Python3使用文本和(二进制)数据的理念代替之前的Unicode字符串和8-bit字符串,所有的文本默认是Unicode编码。使用str类型保存文本,使用bytes类型保存数据。当你混淆文本和数据的时候Python3会抛出TypeError的错误。 - 不能再使用u”…”字面量表示unicode文本,而必须使用b”…”字面量表示二进制数据。 - 因为str和bytes不能弄混,所以你必须显式地将他们进行转换。使用str.encode()将str转换为bytes，使用bytes.decode()将bytes转换为str,也可以使用bytes(s, encoding=…)和str(b, encoding=…)。 - str和bytes都是不可变的类型，有一个分离的可变类型的bytearray可以保存缓存的二进制数据,所有能够接受bytes的API都能够使用bytearray。这些可变的API是基于collections.MutableSequence的。 - 移除了抽象类型basestring，使用str代替。 - 文件默认使用文本类型打开,这也是open()函数默认的。如果要打开二进制文件必须使用b参数,否则会出现错误,而不会默默地提供错误的数据。 - 文件名都使用unicode字符串传入和输出。 - 一些关于系统的API，如os.environ和sys.argv,当系统允许bytes并且不能正常转换为unicode的话,也会出现问题。所以，将系统的LANG设置好是最好的做法。 - repr()函数不再转义非ASCII字符。 - 代码默认为UTF-8编码。 - 移除了StringIO和cStringIO。加入了io模块,并分别使用io.StringIO和io.BytesIO分别用于text和data。 ### 2、语法改变 #### 2.1 新增语法 - 函数变量和返回值[annotations](http://www.python.org/dev/peps/pep-3107/)。 - [Keyword-only](http://www.python.org/dev/peps/pep-3102/)变量。 - nonlocal声明。使用nonlocal x可以直接引用一个外部作用域的变量,但不是全局变量。 - 扩展了迭代的解包。 ~~~ (a, *rest, b) = range(5) a # 0 rest # [1,2,3] b # 4 ~~~ - 字典推导。{k: v for k, v in stuff }。 ~~~ t = ((1,1), (2,2)) d = {k: v for k, v in t} d # {1: 1, 2: 2} ~~~ - 集合推导。{x for x in stuff}，与set(stuff)效果一样,但是更加灵活。 - 八进制字面量0o720。 - 二进制字面量0b1010,相当于新的内置函数bin()。 - 字节字面量b或者B,相当于新的内置函数bytes()。 #### 2.2 改变的语法 ~~~ # old class C: __metaclass__ = M .... # new class C(metaclass=M): .... ~~~ - 列表推导不再支持[... for var in item1, item2, ...]，必须写成[... for var in (item1, item2,...)]。 - 省略号…作为连续表达式可以用于任何地方,之前只能用于分片中。但是必须连续写,之前带空格的. . .不再支持。 #### 2.3 移除的语法 - 移除了元组的解包。不能再写def foo(a, (b, c)): ….,需要写成def foo(a, b_c):b, c = b_c。 - 移除<>,使用!=代替。 - exec()不能再作为关键词,只能作为一个函数。并且exec()不再支持流变量,如exec(f)需写成exec(f.read())。 - 整型不支持l/L后缀。 - 字符串不支持’u/U’前缀。 - from module import *只能用在模块级,在函数中不可使用。 - 所有不以.开始的import语句均作为绝对路径的import对待。 - 移除了经典类。 ### 3、推荐阅读： ### 使用 2to3 将代码移植到 Python 3 [http://woodpecker.org.cn/diveintopython3/porting-code-to-python-3-with-2to3.html](http://woodpecker.org.cn/diveintopython3/porting-code-to-python-3-with-2to3.html) Moving from Python 2 to Python 3 [http://ptgmedia.pearsoncmg.com/imprint_downloads/informit/promotions/python/python2python3.pdf](http://ptgmedia.pearsoncmg.com/imprint_downloads/informit/promotions/python/python2python3.pdf)