# 3.4 使用筛选器
在预处理阶段,可以定义筛选器来以各种方式对数据进行变换。Filter 一栏用于对各
种筛选器进行必要的设置。Filter 一栏的左边是一个 Choose 按钮。点击这个按钮就可 选择 WEKA 中的某个筛选器。选定一个筛选器后,它的名字和选项会显示在 Choose 按 钮旁边的文本框中。用鼠标左键点击这个框,将出现一个 GenericObjectEditor(通用对象 编辑器)对话框。用鼠标右键(或Alt+Shift+左键)点击将出现一个菜单,你可从中选择, 要么在 GenericObjectEditor 对话框中显示相关属性,要么将当前的设置字符复制到剪贴 板。
![](https://box.kancloud.cn/2016-01-22_56a1c4af371bd.png)
GenericObjectEditor 对话框
GenericObjectEditor 对话框可以用来配置一个筛选器。同样的对话框也用于配置其他 对象,例如分类器(classifier)和 聚类器(clusterers)(见下文)。窗口中的字段反映了可 用的选项。点击它们中间的一个便可改变 filter 的设置。例如,某项设置可能是一串文本 字符,这时将字符串输入相应的文本框中即可。或者它可能会给出一个下拉框,列出可供 选择的几个状态。也可能是其他一些操作,根据所需的信息而有所区别。如果把将鼠标指 针停留在某个字段上,会出现一个小提示来给出相应选项的信息。而有关该筛选器和它的 选项的更多信息可通过点击 GenericObjectEditor 窗口顶部 About 面板中的 More 按 钮来获得。
除了 More 按钮,某些对象也会在关于栏中显示一些有关其功能的简短描述。点击 More 按钮,会出现一个窗口来描述了不同的选项分别起什么作用。有的还另外一个 Capabilities 按钮,它能列出该对象可处理的属性和 class 属性的类型。
GenericObjectEditor 对话框的底部有4个按钮。前两个 Open... 和 Save... 允许存储 对该对象的配置,以备将来之用。Cancel 按钮用于直接退出,任何已作出的改变都将被 忽略。当前选择的对象和设置令人满意后,点击 OK 返回到主 Explorer 窗口。
应用筛选器
选择并配置好一个筛选器后,就可通过点击 Preprocess 面板的 Filter 拦右边的 Apply 按钮将之应用于数据集上。然后 Preprocess 面板将显示转换过的数据。可点击 Undo 按钮取消改变。你也可使用 Edit... 按钮在一个数据集编辑器中手动修改你的数 据。最后,点击 Preprocess 面板右上角的 Save... 按钮将用同样的格式保存当前的关系, 以备将来使用。
注意:一些筛选器会依据是否设置了 class 属性来做出不同的动作。(点击直方图上 方那一栏时,会出现一个可供选择的下拉列表。)特别的,`supervised filters`(监督 式筛选器)需要设置一个 class 属性, 而某些`unsupervised attribute filters`(非监督 式属性筛选器)将忽略 class 属性。注意也可以将 Class 设成 None,这时没有设置 class 属性。
> 3 筛选器的英文原文是 filter,与数据库术语中的筛选有关。但是 WEKA 中的 filter 不仅能提供筛选功能, 还涵盖了其他各种数据变换。—译注。
- 1 启动 WEKA
- 2 WEKA Explorer
- 2.1 标签页
- 2.2 状态栏
- 2.3 Log 按钮
- 2.4 WEKA 状态图标
- 3 预处理
- 3.1 载入数据
- 3.2 当前关系
- 3.3 处理属性
- 3.4 使用筛选器
- 4 分类
- 4.1 选择分类器
- 4.2 测试选项
- 4.3 Class 属性
- 4.4 训练分类器
- 4.5 分类器输出文本
- 4.6 结果列表
- 5 聚类
- 5.1 选择聚类器(Clusterer)
- 5.2 聚类模式
- 5.3 忽略属性
- 5.4 学习聚类
- 6 关联规则
- 6.1 设定
- 6.2 学习关联规则
- 7 属性选择
- 7.1 搜索与评估
- 7.2 选项
- 7.3 执行选择
- 8 可视化
- 8.1 散点图矩阵
- 8.2 选择单独的二维散点图
- 8.3 选择实例
- 参考文献