💎一站式轻松地调用各大LLM模型接口,支持GPT4、智谱、星火、月之暗面及文生图 广告
# 6.6. 全部放在一起 再一次,所有的多米诺骨牌都放好了。我们已经看过每行代码是如何工作的了。现在往回走一步,看一下放在一起是怎么样的。 ## 例 6.21. `listDirectory` ``` def listDirectory(directory, fileExtList): "get list of file info objects for files of particular extensions" fileList = [os.path.normcase(f) for f in os.listdir(directory)] fileList = [os.path.join(directory, f) for f in fileList if os.path.splitext(f)[1] in fileExtList] def getFileInfoClass(filename, module=sys.modules[FileInfo.__module__]): "get file info class from filename extension" subclass = "%sFileInfo" % os.path.splitext(filename)[1].upper()[1:] return hasattr(module, subclass) and getattr(module, subclass) or FileInfo return [getFileInfoClass(f)(f) for f in fileList] ``` | | | | --- | --- | | \[1\] | `listDirectory` 是整个模块主要的有趣之处。它接收一个 dictionary (在我的例子中如 `c:\music\_singles\`) 和一个感兴趣的文件扩展名列表 (如 `['.mp3']`),接着它返回一个类实例的 list ,这些类实例的行为像 dictionary,包含了在目录中每个感兴趣文件的元数据。并且实现起来只用了几行直观的代码。 | | \[2\] | 正如在[前一节](os_module.html "6.5. 与目录共事")我们所看到的,这行代码得到一个全路径名的列表,它的元素是在 `directory` 中有着我们感兴趣的文件后缀 (由 `fileExtList` 所指定的) 的所有文件的路径名。 | | \[3\] | 老学校出身的 Pascal 程序员可能对嵌套函数感到熟悉,但大部分人,当我告诉他们 Python 支持嵌套函数时,都茫然地看着我。_嵌套函数_,从字面理解,是定义在函数内的函数。嵌套函数 `getFileInfoClass` 只能在定义它的函数 `listDirectory` 内进行调用。正如任何其它的函数一样,不需要一个接口声明或奇怪的什么东西,只要定义函数,开始编码就行了。 | | \[4\] | 既然你已经看过 [`os`](os_module.html "6.5. 与目录共事") 模块了,这一行应该能理解了。它得到文件的扩展名 (`os.path.splitext(filename)[1]`),将其转换为大写字母 (`.upper()`),从圆点处进行分片 (`[1:]`),使用字符串格式化从其中生成一个类名。所以 `c:\music\ap\mahadeva.mp3` 变成 `.mp3` 再变成 `MP3` 再变成 `MP3FileInfo`。 | | \[5\] | 在生成完处理这个文件的处理类的名字之后,我们查阅在这个模块中是否存在这个处理类。如果存在,我们返回这个类,否则我们返回基类 `FileInfo`。这一点很重要:_这个函数返回一个类_。不是类的实例,而是类本身。 | | \[6\] | 对每个属于我们 “感兴趣文件” 列表 (`fileList`)中的文件,我们用文件名 (`f`) 来调用 `getFileInfoClass`。调用 `getFileInfoClass(f)` 返回一个类;我们并不知道确切是哪一个类,但是我们并不关心。接着我们创建这个类 (不管它是什么) 的一个实例,传入文件名 (又是 `f`) 给 `__init__` 方法。正如我们在[本章的前面](../object_oriented_framework/special_class_methods.html#fileinfo.specialmethods.setname "例 5.15. 设置 MP3FileInfo 的 name")所看到的,`FileInfo` 的 `__init__` 方法设置了 `self["name"]`,它将引发 `__setitem__` 的调用,而 `__setitem__` 在子类 (`MP3FileInfo`) 中被覆盖掉了,用来适当地对文件进行分析,取出文件的元数据。我们对所有感兴趣的文件进行处理,返回结果实例的一个 list。 | 请注意 `listDirectory` 完全是通用的。它事先不知道将得到哪种类型的文件,也不知道哪些定义好的类能够处理这些文件。它检查目录中要进行处理的文件,然后反观本身模块,了解定义了什么特别的处理类 (像 `MP3FileInfo`)。你可以对这个程序进行扩充,对其它类型的文件进行处理,只要用适合的名字定义类:`HTMLFileInfo` 用于 HTML 文件,`DOCFileInfo` 用于 Word `.doc` 文件,等等。不需要改动函数本身, `listDirectory` 将会对它们都进行处理,将工作交给适当的类,接着收集结果。