[TOC]
## 四、综合题
**1.请描述K-Means算法的步骤,算法的缺点及改进。**
**2.请简述KNN算法的步骤。**
**3.请列举不少于四个分类算法,简单介绍算法原理**
**4.下表给出了一组数据的相似矩阵**
![](https://img.kancloud.cn/69/46/6946449718e9ec30030a508bbabe2084_579x207.png)
**  1)使用单链接(MIN)方式进行层次聚类,请画出对应的树状图。**
**  2)使用全链接(MAX)方式进行层次聚类,请画出对应的树状图。**
**5.请对比分析boosting和bagging。**
**6.请简述数据挖掘的整个过程。**
**7.请谈谈你对特征工程的理解。**
**8.请简述什么是过拟合问题、产生的原因有哪些以及解决过拟合的办法。**