🔥码云GVP开源项目 12k star Uniapp+ElementUI 功能强大 支持多语言、二开方便! 广告
# 5.2 聚类模式 Cluster Mode 一栏用来决定依据什么来聚类以及如何评价聚类的结果。前三个选项和分类的情形是一样的:Use training set、 Supplied test set 和 Percentage split (见4.1节)——区别在于现在的数据是要聚集到某个类中,而不是预测为某个指定的类 别。第四个模式,Classes to clusters evaluation,是要比较所得到的聚类与在数据中 预先给出的类别吻合得怎样。和 Classify 面板一样,下方的下拉框是用来选择作为类别 的属性的。 在 Cluster mode 之外,有一个 Store clusters for visualization 的勾选框,该框决定 了在训练完算法后可否对数据进行可视化。对于非常大的数据集,内存可能成为瓶颈时, 不勾选这一栏应该会有所帮助。