> 针对小学、初中、高中和大学生四个不同层次的学生编写4套不同的数据挖掘的讲义,方便上课的老师备课。
小学生
以图形化方式展示数据挖掘的任务,并通过经典的、学生容易理解的生活中的问题为导向,应用最简单的算法实现,不讲算法的原理部分。
问题:
* 鸢尾花的分类(分类问题)
* 鸢尾花的聚类(聚类问题,k-NN)
* 手写数字的识别(分类问题)
* 房价预测问题(线性回归问题)
* 泰坦尼克号生存预测(决策树问题)
* 快递箱选址问题(K-means聚类问题)
中学生
以图形化方式分析任务,并配以Python脚本的方式介绍最基本的算法,解决实际的问题,高年级讲解模型的参数选择以及优化。
问题:
* 鸢尾花的分类
* 鸢尾花的聚类
* 手写数字的识别
大学生
以图形化方式建模、感性认识算法的概念,Python脚本配合scikit-learn机器学习库讲解主要的算法使用,并深入分析算法的原理以及背后的数学背景知识。
问题:
* 鸢尾花的分类
* 鸢尾花的聚类
* 手写数字的识别