用AI赚第一桶💰低成本搭建一套AI赚钱工具,源码可二开。 广告
### 10. 标准库概览 ### 10.1. 操作系统接口 [os](# "os: Miscellaneous operating system interfaces.")模块提供了几十个函数与操作系统交互: ~~~ >>> import os >>> os.getcwd() # Return the current working directory 'C:\\Python34' >>> os.chdir('/server/accesslogs') # Change current working directory >>> os.system('mkdir today') # Run the command mkdir in the system shell 0 ~~~ 一定要使用importos的形式而不要用fromosimport*。这将避免[os.open()](# "os.open")屏蔽内置的[open()](# "open")函数,它们的功能完全不同。 内置的[dir()](# "dir")和[help()](# "help")函数对于使用像[os](# "os: Miscellaneous operating system interfaces.")大型模块可以作为非常有用的交互式帮助: ~~~ >>> import os >>> dir(os) <returns a list of all module functions> >>> help(os) <returns an extensive manual page created from the module's docstrings> ~~~ 对于日常的文件和目录管理任务,[shutil](# "shutil: High-level file operations, including copying.")模块提供了一个易于使用的高级接口: ~~~ >>> import shutil >>> shutil.copyfile('data.db', 'archive.db') 'archive.db' >>> shutil.move('/build/executables', 'installdir') 'installdir' ~~~ ### 10.2. 文件通配符 [glob](# "glob: Unix shell style pathname pattern expansion.")模块提供了一个函数用于在目录中以通配符搜索文件,并生成匹配的文件列表: ~~~ >>> import glob >>> glob.glob('*.py') ['primes.py', 'random.py', 'quote.py'] ~~~ ### 10.3. 命令行参数 常见的实用程序脚本通常需要处理命令行参数。这些参数以一个列表存储在[sys](# "sys: Access system-specific parameters and functions.")模块的*argv *属性中。例如下面的输出结果来自于从命令行运行pythondemo.pyone two three: ~~~ >>> import sys >>> print(sys.argv) ['demo.py', 'one', 'two', 'three'] ~~~ [getopt](# "getopt: Portable parser for command line options; support both short and long option names.")模块使用Unix [getopt()](# "getopt: Portable parser for command line options; support both short and long option names.")函数的约定处理*sys.argv*。[argparse](# "argparse: Command-line option and argument parsing library.")模块提供更强大、 更灵活的命令行处理功能。 ### 10.4. 错误输出重定向和程序终止 [sys](# "sys: Access system-specific parameters and functions.")模块还具有*stdin*、*stdout*和*stderr*属性。即使在*stdout*被重定向时,后者也可以用于显示警告和错误信息: ~~~ >>> sys.stderr.write('Warning, log file not found starting a new one\n') Warning, log file not found starting a new one ~~~ 终止脚本最直接的方法来是使用sys.exit()。 ### 10.5. 字符串模式匹配 [re](# "re: Regular expression operations.")模块为高级的字符串处理提供了正则表达式工具。对于复杂的匹配和操作,正则表达式提供了简洁、优化的解决方案: ~~~ >>> import re >>> re.findall(r'\bf[a-z]*', 'which foot or hand fell fastest') ['foot', 'fell', 'fastest'] >>> re.sub(r'(\b[a-z]+) \1', r'\1', 'cat in the the hat') 'cat in the hat' ~~~ 当只需要简单的功能时,最好使用字符串方法,因为它们更容易阅读和调试: ~~~ >>> 'tea for too'.replace('too', 'two') 'tea for two' ~~~ ### 10.6. 数学 [math](# "math: Mathematical functions (sin() etc.).")模块为浮点运算提供了对底层 C 函数库的访问: ~~~ >>> import math >>> math.cos(math.pi / 4.0) 0.70710678118654757 >>> math.log(1024, 2) 10.0 ~~~ [random](# "random: Generate pseudo-random numbers with various common distributions.")模块提供了进行随机选择的工具: ~~~ >>> import random >>> random.choice(['apple', 'pear', 'banana']) 'apple' >>> random.sample(range(100), 10) # sampling without replacement [30, 83, 16, 4, 8, 81, 41, 50, 18, 33] >>> random.random() # random float 0.17970987693706186 >>> random.randrange(6) # random integer chosen from range(6) 4 ~~~ SciPy项目<[http://scipy.org](http://scipy.org)>有很多其它用于数值计算的模块。 ### 10.7. 互联网访问 有很多的模块用于访问互联网和处理的互联网协议。最简单的两个是从URL获取数据的[urllib.request](# "urllib.request: Extensible library for opening URLs.") 和发送邮件的[smtplib](# "smtplib: SMTP protocol client (requires sockets)."): ~~~ >>> from urllib.request import urlopen >>> for line in urlopen('http://tycho.usno.navy.mil/cgi-bin/timer.pl'): ... line = line.decode('utf-8') # Decoding the binary data to text. ... if 'EST' in line or 'EDT' in line: # look for Eastern Time ... print(line) <BR>Nov. 25, 09:43:32 PM EST >>> import smtplib >>> server = smtplib.SMTP('localhost') >>> server.sendmail('soothsayer@example.org', 'jcaesar@example.org', ... """To: jcaesar@example.org ... From: soothsayer@example.org ... ... Beware the Ides of March. ... """) >>> server.quit() ~~~ (请注意第二个示例需要在本地主机上运行邮件服务器)。 ### 10.8. 日期和时间 [datetime](# "datetime: Basic date and time types.")模块提供了处理日期和时间的类,既有简单的方法也有复杂的方法。支持日期和时间算法的同时,实现的重点放在更有效的处理和格式化输出。该模块还支持处理时区。 ~~~ >>> # dates are easily constructed and formatted >>> from datetime import date >>> now = date.today() >>> now datetime.date(2003, 12, 2) >>> now.strftime("%m-%d-%y. %d %b %Y is a %A on the %d day of %B.") '12-02-03. 02 Dec 2003 is a Tuesday on the 02 day of December.' >>> # dates support calendar arithmetic >>> birthday = date(1964, 7, 31) >>> age = now - birthday >>> age.days 14368 ~~~ ### 10.9. 数据压缩 常见的数据打包和压缩格式有模块直接支持,包括:[zlib](# "zlib: Low-level interface to compression and decompression routines compatible with gzip."), [gzip](# "gzip: Interfaces for gzip compression and decompression using file objects."), [bz2](# "bz2: Interfaces for bzip2 compression and decompression."), [lzma](# "lzma: A Python wrapper for the liblzma compression library."), [zipfile](# "zipfile: Read and write ZIP-format archive files.") 和 [tarfile](# "tarfile: Read and write tar-format archive files.")。 ~~~ >>> import zlib >>> s = b'witch which has which witches wrist watch' >>> len(s) 41 >>> t = zlib.compress(s) >>> len(t) 37 >>> zlib.decompress(t) b'witch which has which witches wrist watch' >>> zlib.crc32(s) 226805979 ~~~ ### 10.10. 性能度量 一些 Python 用户对同一问题的不同解决方法之间的性能差异深有兴趣。Python 提供了的一个度量工具可以立即解决这些问题。 例如,使用元组封装和拆封功能而不是传统的方法来交换参数可能会更吸引人。[timeit](# "timeit: Measure the execution time of small code snippets.")模块快速证明了现代的方法更快一些: ~~~ >>> from timeit import Timer >>> Timer('t=a; a=b; b=t', 'a=1; b=2').timeit() 0.57535828626024577 >>> Timer('a,b = b,a', 'a=1; b=2').timeit() 0.54962537085770791 ~~~ 与[timeit](# "timeit: Measure the execution time of small code snippets.")的精细的粒度相反,[profile](# "profile: Python source profiler.")和[pstats](# "pstats: Statistics object for use with the profiler.")模块提供了针对更大代码块的时间度量工具。 ### 10.11. 质量控制 开发高质量软件的方法之一是为每一个函数开发测试代码,并且在开发过程中经常进行测试。 [doctest](# "doctest: Test pieces of code within docstrings.")模块提供一个工具,扫描模块并根据程序中内嵌的文档字符串执行测试。测试构造如同简单的将它的输出结果剪切并粘贴到文档字符串中。通过用户提供的例子,它发展了文档,允许 doctest 模块确认代码的结果是否与文档一致: ~~~ def average(values): """Computes the arithmetic mean of a list of numbers. >>> print(average([20, 30, 70])) 40.0 """ return sum(values) / len(values) import doctest doctest.testmod() # automatically validate the embedded tests ~~~ [unittest](# "unittest: Unit testing framework for Python.")模块不像[doctest](# "doctest: Test pieces of code within docstrings.")模块那样容易,不过它可以在一个独立的文件里提供一个更全面的测试集: ~~~ import unittest class TestStatisticalFunctions(unittest.TestCase): def test_average(self): self.assertEqual(average([20, 30, 70]), 40.0) self.assertEqual(round(average([1, 5, 7]), 1), 4.3) with self.assertRaises(ZeroDivisionError): average([]) with self.assertRaises(TypeError): average(20, 30, 70) unittest.main() # Calling from the command line invokes all tests ~~~ ### 10.12. Batteries Included Python 有"Batteries Included"的哲学。这最好是通过其较大的文件包的先进和强大功能。例如: - [xmlrpc.client](# "xmlrpc.client: XML-RPC client access.")和[xmlrpc.server](# "xmlrpc.server: Basic XML-RPC server implementations.")模块让远程过程调用变得轻而易举。尽管模块有这样的名字,它不需要直接XML知识或处理 XML 。 - [email](# "email: Package supporting the parsing, manipulating, and generating email messages, including MIME documents.")包是是一个处理电子邮件的库,包括MIME和其它基于RFC 2822的邮件。与[smtplib](# "smtplib: SMTP protocol client (requires sockets).")和[poplib](# "poplib: POP3 protocol client (requires sockets).")用于实际发送和接收邮件,email包有一个完整的工具集用于构建或者解码复杂邮件结构(包括附件),并实现互联网编码和头协议。 - [xml.dom](# "xml.dom: Document Object Model API for Python.")和[xml.sax](# "xml.sax: Package containing SAX2 base classes and convenience functions.")的包为这种流行的数据交换格式提供了强大的支持。同样,[csv](# "csv: Write and read tabular data to and from delimited files.")模块支持以常见的数据库格式直接读取和写入。这些模块和包一起大大简化了 Python 应用程序和其他工具之间的数据交换。 - 国际化支持模块包括[gettext](# "gettext: Multilingual internationalization services.")、[locale](# "locale: Internationalization services.")和[codecs](# "codecs: Encode and decode data and streams.")包。