# 3.3 处理属性
在 Current relation 一栏下是 Attributes(属性)栏。有四个按钮,其下是当前关系中的属性列表。该列表有3列:
1\. No.. 一个数字,用来标识数据文件中指定的各属性的顺序。
2\. 选择框. 允许勾选关系中呈现的各属性。
3\. Name. 数据文件中声明的各属性的名称。
当点击属性列表中的不同行时,右边 Selected attribute 一栏的内容随之改变。这 一栏给出了列表中当前高亮显示的属性的一些描述:
1\. Name. 属性的名称,和属性列表中给出的相同。
2\. Type. 属性的类型,最常见的是分类型(Nominal)和数值型(Numeric)。
3\. Missing. 数据中该属性缺失(或者未指定)的实例的数量(及百分比)。
4\. Distinct. 数据中该属性包含的不同值的数目。
5\. Unique. 唯一地拥有某值的实例的数目(及百分比),这些实例每个的取值都和 别的不一样。
在这些统计量的下面是一个列表,根据属性的不同类型,它显示了关于这个属性中储存 的值的更多信息。如果属性是分类型的,列表将包含该属性的每个可能值以及取那个值的 实例的数目。如果属性是数值型的,列表将给出四个统计量来描述数据取值的分布—最小 值、最大值、平均值和标准差。在这些统计量的下方,有一个彩色的直方图,根据直方图 上方一栏所选择的 class 属性来着色。(在点击时,该栏将显示一个可供选择的下拉列表。) 注意仅有分类型的 class 属性才会让直方图出现彩色。最后,若点击 Visualize All 按钮, 将在一个单独的窗口中显示数据集中所有属性的直方图。
回到属性列表,开始时所有的选择框都是没有被勾选的。可通过逐个点击来勾选/取消。 以上的4个按钮也可用于改变选择:
1\. All. 所有选择框都被勾选。
2\. None. 所有选择框被取消(没有勾选)。
3\. Invert. 已勾选的选择框都被取消,反之亦然。
4\. Pattern. 让用户基于 Perl 5 正则表达式来选择属性。例如,用 *_id 选择所有名 称以 _id 结束的属性。
选中了想要的属性后,可通过点击属性列表下的 Remove 按钮删除他们。注意可通 过点击位于 Preprocess 面板的右上角的 Edit 按钮旁的 Undo 按钮来取消操作。
- 1 启动 WEKA
- 2 WEKA Explorer
- 2.1 标签页
- 2.2 状态栏
- 2.3 Log 按钮
- 2.4 WEKA 状态图标
- 3 预处理
- 3.1 载入数据
- 3.2 当前关系
- 3.3 处理属性
- 3.4 使用筛选器
- 4 分类
- 4.1 选择分类器
- 4.2 测试选项
- 4.3 Class 属性
- 4.4 训练分类器
- 4.5 分类器输出文本
- 4.6 结果列表
- 5 聚类
- 5.1 选择聚类器(Clusterer)
- 5.2 聚类模式
- 5.3 忽略属性
- 5.4 学习聚类
- 6 关联规则
- 6.1 设定
- 6.2 学习关联规则
- 7 属性选择
- 7.1 搜索与评估
- 7.2 选项
- 7.3 执行选择
- 8 可视化
- 8.1 散点图矩阵
- 8.2 选择单独的二维散点图
- 8.3 选择实例
- 参考文献