# 5.2 聚类模式
Cluster Mode 一栏用来决定依据什么来聚类以及如何评价聚类的结果。前三个选项和分类的情形是一样的:Use training set、 Supplied test set 和 Percentage split (见4.1节)——区别在于现在的数据是要聚集到某个类中,而不是预测为某个指定的类 别。第四个模式,Classes to clusters evaluation,是要比较所得到的聚类与在数据中 预先给出的类别吻合得怎样。和 Classify 面板一样,下方的下拉框是用来选择作为类别 的属性的。
在 Cluster mode 之外,有一个 Store clusters for visualization 的勾选框,该框决定 了在训练完算法后可否对数据进行可视化。对于非常大的数据集,内存可能成为瓶颈时, 不勾选这一栏应该会有所帮助。
- 1 启动 WEKA
- 2 WEKA Explorer
- 2.1 标签页
- 2.2 状态栏
- 2.3 Log 按钮
- 2.4 WEKA 状态图标
- 3 预处理
- 3.1 载入数据
- 3.2 当前关系
- 3.3 处理属性
- 3.4 使用筛选器
- 4 分类
- 4.1 选择分类器
- 4.2 测试选项
- 4.3 Class 属性
- 4.4 训练分类器
- 4.5 分类器输出文本
- 4.6 结果列表
- 5 聚类
- 5.1 选择聚类器(Clusterer)
- 5.2 聚类模式
- 5.3 忽略属性
- 5.4 学习聚类
- 6 关联规则
- 6.1 设定
- 6.2 学习关联规则
- 7 属性选择
- 7.1 搜索与评估
- 7.2 选项
- 7.3 执行选择
- 8 可视化
- 8.1 散点图矩阵
- 8.2 选择单独的二维散点图
- 8.3 选择实例
- 参考文献