# 机器学习分类器
> 原文: [https://pythonbasics.org/machine-learning-classifier/](https://pythonbasics.org/machine-learning-classifier/)
分类是机器学习任务之一。 那么什么是分类呢?
您一直都在对数据进行分类。
看看任何物体,您将立即知道它属于哪个类:它是杯子,桌子还是椅子。这是分类的任务,计算机可以执行此操作(基于数据)。
本文是面向初学者的机器学习。 让我们做第一个机器学习程序
## 监督机器学习
### 训练数据
导入机器学习模块`sklearn`。 (受监督)机器学习算法使用示例或训练数据。 训练阶段是机器学习算法的第一步。
**由于使用示例数据,因此请首先收集数据**。像一组苹果和桔子的图像,并记下了特征。
**特征可用于区分两个类别**。特征是一种属性,例如颜色,形状或重量。 它可以表示为数值。
关键任务之一是从训练数据中获得良好的特征。 写下每个图像的类别。 类别是类,对于苹果,您可以选择 0 类,对于橘子,您可以采用 1 类。
您可以根据需要设置任意多个类,但是在此示例中,我们将使用 2 个类(苹果和橘子)。
![machine learning training data for classifier](https://img.kancloud.cn/4a/f9/4af93e0694fb210b94faa05b92a90072_1097x413.jpg)
水平写入特征,该线代表第一张图像。
因此,这称为特征向量。 这组数字代表图像。
### 分类器
在训练阶段之后,分类器**可以做出预测**。给定一个新的特征向量,该图像是苹果还是桔子?
分类算法有多种类型,其中一种是决策树。
如果您有新数据,则算法可以确定新数据属于哪个类。苹果的输出为`[0]`,橙色的输出为`[1]`。
所以这是新数据,然后我们简单地使算法进行预测。
```py
from sklearn import tree
features = [[0,50],[0,60],[1,35],[1,36],[1,40]]
labels = [0,0,1,1,1]
algorithm = tree.DecisionTreeClassifier()
algorithm = algorithm.fit(features, labels)
newData = [[0,51]]
print(algorithm.predict(newData))
```
### 过拟合和欠拟合
通常,训练数据越多,分类器就越好。如果您的训练数据很少(不及),那么您将没有好的预测。
因此,总的来说,随着更多数据它变得更加准确。 但是有一个限制,那就是过拟合。
[下载示例和练习](https://gum.co/MnRYU)
- 介绍
- 学习 python 的 7 个理由
- 为什么 Python 很棒
- 学习 Python
- 入门
- 执行 Python 脚本
- 变量
- 字符串
- 字符串替换
- 字符串连接
- 字符串查找
- 分割
- 随机数
- 键盘输入
- 控制结构
- if语句
- for循环
- while循环
- 数据与操作
- 函数
- 列表
- 列表操作
- 排序列表
- range函数
- 字典
- 读取文件
- 写入文件
- 嵌套循环
- 切片
- 多个返回值
- 作用域
- 时间和日期
- try except
- 如何使用pip和 pypi
- 面向对象
- 类
- 构造函数
- 获取器和设置器
- 模块
- 继承
- 静态方法
- 可迭代对象
- Python 类方法
- 多重继承
- 高级
- 虚拟环境
- 枚举
- Pickle
- 正则表达式
- JSON 和 python
- python 读取 json 文件
- 装饰器
- 网络服务器
- 音频
- 用 Python 播放声音
- python 文字转语音
- 将 MP3 转换为 WAV
- 转录音频
- Tkinter
- Tkinter
- Tkinter 按钮
- Tkinter 菜单
- Tkinter 标签
- Tkinter 图片
- Tkinter 画布
- Tkinter 复选框
- Tkinter 输入框
- Tkinter 文件对话框
- Tkinter 框架
- Tkinter 列表框
- Tkinter 消息框
- Tkinter 单选按钮
- Tkinter 刻度
- 绘图
- Matplotlib 条形图
- Matplotlib 折线图
- Seaborn 分布图
- Seaborn 绘图
- Seaborn 箱形图
- Seaborn 热力图
- Seaborn 直线图
- Seaborn 成对图
- Seaborn 调色板
- Seaborn Pandas
- Seaborn 散点图
- Plotly
- PyQt
- PyQt
- 安装 PyQt
- PyQt Hello World
- PyQt 按钮
- PyQt QMessageBox
- PyQt 网格
- QLineEdit
- PyQT QPixmap
- PyQt 组合框
- QCheckBox
- QSlider
- 进度条
- PyQt 表格
- QVBoxLayout
- PyQt 样式
- 编译 PyQt 到 EXE
- QDial
- QCheckBox
- PyQt 单选按钮
- PyQt 分组框
- PyQt 工具提示
- PyQt 工具箱
- PyQt 工具栏
- PyQt 菜单栏
- PyQt 标签小部件
- PyQt 自动补全
- PyQt 列表框
- PyQt 输入对话框
- Qt Designer Python
- 机器学习
- 数据科学
- 如何从机器学习和 AI 认真地起步
- 为什么要使用 Python 进行机器学习?
- 机器学习库
- 什么是机器学习?
- 区分机器学习,深度学习和 AI?
- 机器学习
- 机器学习算法比较
- 为什么要使用 Scikit-Learn?
- 如何在 Python 中加载机器学习数据
- 机器学习分类器
- 机器学习回归
- Python 中的多项式回归
- 决策树
- k 最近邻
- 训练测试拆分
- 人脸检测
- 如何为 scikit-learn 机器学习准备数据
- Selenium
- Selenium 浏览器
- Selenium Cookie
- Selenium 执行 JavaScript
- Selenium 按 ID 查找元素
- Selenium 无头 Firefox
- Selenium Firefox
- Selenium 获取 HTML
- Selenium 键盘
- Selenium 最大化
- Selenium 截图
- Selenium 向下滚动
- Selenium 切换到窗口
- Selenium 等待页面加载
- Flask 教程
- Flask 教程:Hello World
- Flask 教程:模板
- Flask 教程:路由