5.2 聚类模式 · WEKA 3.5.5 用户指南

# 5.2 聚类模式 Cluster Mode 一栏用来决定依据什么来聚类以及如何评价聚类的结果。前三个选项和分类的情形是一样的：Use training set、 Supplied test set 和 Percentage split （见4.1节）——区别在于现在的数据是要聚集到某个类中，而不是预测为某个指定的类别。第四个模式，Classes to clusters evaluation，是要比较所得到的聚类与在数据中预先给出的类别吻合得怎样。和 Classify 面板一样，下方的下拉框是用来选择作为类别的属性的。在 Cluster mode 之外，有一个 Store clusters for visualization 的勾选框，该框决定了在训练完算法后可否对数据进行可视化。对于非常大的数据集，内存可能成为瓶颈时，不勾选这一栏应该会有所帮助。