💎一站式轻松地调用各大LLM模型接口,支持GPT4、智谱、星火、月之暗面及文生图 广告
# 3.4 使用筛选器 在预处理阶段,可以定义筛选器来以各种方式对数据进行变换。Filter 一栏用于对各 种筛选器进行必要的设置。Filter 一栏的左边是一个 Choose 按钮。点击这个按钮就可 选择 WEKA 中的某个筛选器。选定一个筛选器后,它的名字和选项会显示在 Choose 按 钮旁边的文本框中。用鼠标左键点击这个框,将出现一个 GenericObjectEditor(通用对象 编辑器)对话框。用鼠标右键(或Alt+Shift+左键)点击将出现一个菜单,你可从中选择, 要么在 GenericObjectEditor 对话框中显示相关属性,要么将当前的设置字符复制到剪贴 板。 ![](https://box.kancloud.cn/2016-01-22_56a1c4af371bd.png) GenericObjectEditor 对话框 GenericObjectEditor 对话框可以用来配置一个筛选器。同样的对话框也用于配置其他 对象,例如分类器(classifier)和 聚类器(clusterers)(见下文)。窗口中的字段反映了可 用的选项。点击它们中间的一个便可改变 filter 的设置。例如,某项设置可能是一串文本 字符,这时将字符串输入相应的文本框中即可。或者它可能会给出一个下拉框,列出可供 选择的几个状态。也可能是其他一些操作,根据所需的信息而有所区别。如果把将鼠标指 针停留在某个字段上,会出现一个小提示来给出相应选项的信息。而有关该筛选器和它的 选项的更多信息可通过点击 GenericObjectEditor 窗口顶部 About 面板中的 More 按 钮来获得。 除了 More 按钮,某些对象也会在关于栏中显示一些有关其功能的简短描述。点击 More 按钮,会出现一个窗口来描述了不同的选项分别起什么作用。有的还另外一个 Capabilities 按钮,它能列出该对象可处理的属性和 class 属性的类型。 GenericObjectEditor 对话框的底部有4个按钮。前两个 Open... 和 Save... 允许存储 对该对象的配置,以备将来之用。Cancel 按钮用于直接退出,任何已作出的改变都将被 忽略。当前选择的对象和设置令人满意后,点击 OK 返回到主 Explorer 窗口。 应用筛选器 选择并配置好一个筛选器后,就可通过点击 Preprocess 面板的 Filter 拦右边的 Apply 按钮将之应用于数据集上。然后 Preprocess 面板将显示转换过的数据。可点击 Undo 按钮取消改变。你也可使用 Edit... 按钮在一个数据集编辑器中手动修改你的数 据。最后,点击 Preprocess 面板右上角的 Save... 按钮将用同样的格式保存当前的关系, 以备将来使用。 注意:一些筛选器会依据是否设置了 class 属性来做出不同的动作。(点击直方图上 方那一栏时,会出现一个可供选择的下拉列表。)特别的,`supervised filters`(监督 式筛选器)需要设置一个 class 属性, 而某些`unsupervised attribute filters`(非监督 式属性筛选器)将忽略 class 属性。注意也可以将 Class 设成 None,这时没有设置 class 属性。 > 3 筛选器的英文原文是 filter,与数据库术语中的筛选有关。但是 WEKA 中的 filter 不仅能提供筛选功能, 还涵盖了其他各种数据变换。—译注。