机械学习 · python深度学习

# 监督学习 * 目前最**常见**的机器学习类型。 **给定**一组样本（通常由人工标注），它可以学会将输入数据**映射**到已知目标［也叫**标注**（annotation）］ * 例如:光学字符识别、语音识别、图像分类和语言翻译。 ## **类型**： * **分类** * **回归** * **序列生成**（sequence generation）给定一张**图像**，**预测描述图像的文字**。序列生成有时可以被重新表示为一系列分类问题，比如反复预测序列中的单词或标记。 * **语法树预测**（syntax tree prediction）。给定一个**句子**，预测其分解生成的**语法树**。 * **目标检测**（object detection）。给定一张**图像**，在图中特定目标的周围画一个**边界框**。这个问题也可以表示为分类问题（给定多个候选边界框，对每个框内的目标进行分类）或分类与回归联合问题（用向量回归来预测边界框的坐标）。 * **图像分割**（image segmentation）。给定一张图像，在特定物体上**画一个像素级的掩模**（mask）。 ***** # **无监督学习**： * 是指在**没有目标**的情况下寻找输入数据的有趣变换。 * 其目的在于**数据可视化**、**数据压缩**、**数据去噪**或更好地理解**数据中的相关性**。 * 无监督学习是数据分析的**必备技能** * 在解决监督学习问题**之前**，为了更好地了解数据集，它通常是一个必要**步骤**。 * **降维**（dimensionality reduction）和**聚类**（clustering）都是众所周知的无监督学习方法。 ***** # **自监督学习**： * 自监督学习是没有人工标注的标签的监督学习 * 标签仍然存在（因为总要有什么东西来监督学习过程），但它们是从输入数据中生成的，通常是使用启发式算法生成的。 ## **例子**： **自编码器**（autoencoder），生成的目标就是未经修改的输入 **时序监督学习**（temporally supervised learning），用未来的输入数据作为监督： * 给定视频中过去的帧来预测下一帧 * 给定文本中前面的词来预测下一个词 ***** # **强化学习**： * **智能体**（agent）接收有关其环境的信息，并学会选择使某种奖励最大化的行动。例子：google的deep mind ***** # **目的：** 机器学习的目的是得到可以**泛化**（generalize）的模型，即在前所未见的数据上表现很好的模型，而过拟合则是核心难点。