💎一站式轻松地调用各大LLM模型接口,支持GPT4、智谱、星火、月之暗面及文生图 广告
# 实用机器学习问题 > 原文: [https://machinelearningmastery.com/practical-machine-learning-problems/](https://machinelearningmastery.com/practical-machine-learning-problems/) 什么是机器学习?我们可以阅读[机器学习](http://machinelearningmastery.com/what-is-machine-learning/ "What is Machine Learning: A Tour of Authoritative Definitions and a Handy One-Liner You Can Use")的权威定义,但实际上,机器学习是由正在解决的问题定义的。因此,了解机器学习的最佳方法是查看一些示例问题。 在这篇文章中,我们将首先看一些现实世界中机器学习问题的众所周知和理解的例子。然后,我们将查看标准机器学习问题的分类法(命名系统),并学习如何将问题识别为这些标准案例之一。这很有价值,因为了解我们面临的问题类型可以让我们考虑我们需要的数据以及要尝试的算法类型。 ## 10 机器学习问题的例子 机器学习问题比比皆是。它们构成了您每天在网络或桌面上使用的软件的核心或难点部分。想想推特上的“你想跟随”的建议以及 Apple 的 Siri 中的言语理解。 下面是 10 个机器学习的例子,它们真正奠定了机器学习的全部意义。 * **垃圾邮件检测**:根据收件箱中的电子邮件,识别那些垃圾邮件和非垃圾邮件。拥有此问题的模型将允许程序将非垃圾邮件留在收件箱中并将垃圾邮件移动到垃圾邮件文件夹。我们都应该熟悉这个例子。 * **信用卡欺诈检测**:给定一个月内客户的信用卡交易,确定客户和非客户进行的交易。具有此决定模型的程序可以退还那些欺诈性交易。 * **数字识别**:给定一个手写在信封上的邮政编码,识别每个手写字符的数字。该问题的模型将允许计算机程序读取和理解手写邮政编码并按地理区域对信封进行排序。 * **语音理解**:给定用户的话语,识别用户提出的具体请求。该问题的模型将允许程序理解并尝试满足该请求。带 Siri 的 iPhone 具有这种功能。 * **人脸检测**:鉴于数百张数码照片的数码相册,请识别包含特定人物的照片。该决策过程的模型将允许程序按人员组织照片。一些相机和像 iPhoto 这样的软件具有这种功能。 ![Face Detection](img/6744d0447f044faf679c34427ac885d3.jpg) 照片中的人脸检测示例。 先生的照片。 'sto 根据署名 - ShareAlike 2.0 通用知识共享许可获得许可。 * **产品推荐**:鉴于客户的购买历史记录和大量产品库存,请确定该客户将感兴趣并可能购买的产品。该决策过程的模型将允许程序向客户提出建议并激励产品购买。亚马逊有这种能力。还要考虑 Facebook,GooglePlus 和 LinkedIn,建议用户在注册后与您联系。 * **医学诊断**:鉴于患者和匿名患者记录数据库中显示的症状,预测患者是否可能患病。程序可以使用该决策问题的模型来为医疗专业人员提供决策支持。 * **股票交易**:鉴于股票当前和过去的价格变动,确定该股票是否应该被买入,持有或卖出。这个决策问题的模型可以为金融分析师提供决策支持。 * **客户细分**:鉴于用户在试用期间的行为模式以及所有用户的过去行为,请确定将转换为产品付费版本的用户和不转换为付费版本的用户。该决策问题的模型将允许程序触发客户干预以说服客户提前或更好地参与试验。 * **形状检测**:给定用户手在触摸屏上绘制形状和已知形状的数据库,确定用户试图绘制的形状。该决定的模型将允许程序显示用户绘制的用于制作清晰图表的那种形状的柏拉图版本。 [Instaviz](http://instaviz.com) iPhone 应用程序就是这样做的。 这 10 个例子很好地理解了机器学习问题。有一个历史性的例子,有一个需要建模的决定,一个企业或领域的好处,使自己的决策建模和有效。 其中一些问题是人工智能中最难的问题,例如自然语言处理和机器视觉(人类很容易做的事情)。其他人仍然很难,但却是机器学习的经典例子,如垃圾邮件检测和信用卡欺诈检测。 想想你上周在线和离线软件的一些互动。我相信你可以很容易地猜到你直接或间接使用的另外十或二十个机器学习的例子。 ## 机器学习问题的类型 通过阅读上面的示例机器学习问题列表,我相信你可以开始看到相似之处。这是一项有价值的技能,因为善于提取问题的本质将使您能够有效地思考您需要哪些数据以及您应该尝试哪种类型的算法。 机器学习中存在常见的问题类别。下面的问题类是我们 _ 做 _ 机器学习时我们提到的大多数问题的原型。 * **分类**:数据被标记为意味着它被分配了一个类,例如垃圾邮件/非垃圾邮件或欺诈/非欺诈。建模的决定是为新的未标记数据分配标签。这可以被认为是歧视问题,模拟群体之间的差异或相似性。 * **回归**:数据标有实数值(想想浮点数),而不是标签。易于理解的示例是时间序列数据,如股票价格随时间的变化,建模的决策是预测新的不可预测数据的值。 * **聚类**:数据没有标记,但可以根据数据中自然结构的相似性和其他度量进行分组。上面列表中的一个示例是通过没有名称的面部组织图片,其中人类用户必须为组指定名称,例如 Mac 上的 iPhoto。 * **规则提取**:数据被用作提取命题规则的基础(先行/结果又名 _if-then_ )。这样的规则可以但通常不是针对性的,这意味着方法发现数据中的属性之间的统计上可支持的关系,不一定涉及正被预测的事物。一个例子是发现购买[啤酒和尿布](https://www.google.com/search?q=data+mining+beer+and+diapers)之间的关系(这是数据挖掘民间法,无论是否真实,它是对欲望和机会的说明)。 当您认为问题是机器学习问题(需要根据数据建模的决策问题)时,请考虑您可以轻松地将其置于何种类型的问题或客户或要求要求和工作的结果类型向后。 ## 资源 几乎没有资源提供真实世界机器学习问题的列表。他们可能在那里,但我找不到他们。我仍然为你找到了一些很酷的资源: * [年度“Humies”奖](http://www.genetic-programming.org/combined.php):这些是通过算法获得的奖品清单,这些算法与人类提出的结果相竞争。这令人兴奋,因为这些算法只能从数据或成本函数中运作,并且能够具有创造性和创造性,足以侵犯专利。惊人! * [AI 效应](http://en.wikipedia.org/wiki/AI_effect):一旦人工智能程序获得足够好的结果,它就不再被视为人工智能,而只是技术并且在日常事物中被使用。同样适用于机器学习。 * [AI-Complete](http://en.wikipedia.org/wiki/AI-complete) :指的是人工智能中非常困难的问题,如果解决这个问题就会成为强 AI(AI 在科幻小说中设想的,真正的 AI)的一个例子。计算机视觉和自然语言处理的问题都是 AI 完全问题的例子,也可能被认为是特定领域的机器学习问题类别。 * [2013 年机器学习的十大问题是什么?](http://www.quora.com/Machine-Learning/What-are-the-Top-10-problems-in-Machine-Learning-for-2013) 这个 Quora 问题有一些很好的答案,并列出了一些广泛的实际机器学习问题。 我们已经回顾了现实世界机器学习问题的一些常见例子以及机器学习问题类别的分类。我们现在有信心评论问题是否是机器学习问题,并从问题描述中挑选元素并确定它是分类,回归,聚类还是规则提取类型的问题。 你知道更多现实世界的机器学习问题吗?发表评论并分享您的想法。