ThinkChat2.0新版上线,更智能更精彩,支持会话、画图、阅读、搜索等,送10W Token,即刻开启你的AI之旅 广告
# 监督学习 * 目前最**常见**的机器学习类型。 **给定**一组样本(通常由人工标注),它可以学会将输入数据**映射**到已知目标[也叫**标注**(annotation)] * 例如:光学字符识别、语音识别、图像分类和语言翻译。 ## **类型**: * **分类** * **回归** * **序列生成**(sequence generation) 给定一张**图像**,**预测描述图像的文字**。 序列生成有时可以被重新表示为一系列分类问题,比如反复预测序列中的单词或标记。 * **语法树预测**(syntax tree prediction)。 给定一个**句子**,预测其分解生成的**语法树**。 * **目标检测**(object detection)。 给定一张**图像**,在图中特定目标的周围画一个**边界框**。这个问题也可以表示为分类问题(给定多个候选边界框,对每个框内的目标进行分类)或分类与回归联合问题(用向量回归来预测边界框的坐标)。 * **图像分割**(image segmentation)。给定一张图像,在特定物体上**画一个像素级的掩模**(mask)。 ***** # **无监督学习**: * 是指在**没有目标**的情况下寻找输入数据的有趣变换。 * 其目的在于**数据可视化**、**数据压缩**、**数据去噪**或更好地理解**数据中的相关性**。 * 无监督学习是数据分析的**必备技能** * 在解决监督学习问题**之前**,为了更好地了解数据集,它通常是一个必要**步骤**。 * **降维**(dimensionality reduction)和**聚类**(clustering)都是众所周知的无监督学习方法。 ***** # **自监督学习**: * 自监督学习是没有人工标注的标签的监督学习 * 标签仍然存在(因为总要有什么东西来监督学习过程),但它们是从输入数据中生成的,通常是使用启发式算法生成的。 ## **例子**: **自编码器**(autoencoder),生成的目标就是未经修改的输入 **时序监督学习**(temporally supervised learning),用未来的输入数据作为监督: * 给定视频中过去的帧来预测下一帧 * 给定文本中前面的词来预测下一个词 ***** # **强化学习**: * **智能体**(agent)接收有关其环境的信息,并学会选择使某种奖励最大化的行动。 例子:google的deep mind ***** # **目的:** 机器学习的目的是得到可以**泛化**(generalize)的模型,即在前所未见的数据上表现很好的模型,而过拟合则是核心难点。