## 数据分析简介
数据分析是指用合适的统计分析方法对收集来的数据进行分析,将这些大量的数据进行汇总,并做成可以被人们消化和理解的资料,从中提取有用的信息。数据分析常常以数和量的形式展现,通过实验、观察、调查等方式获取结果。
## 数据分析的分类
尽管数据分析过程着重于清理、建模和可视化数据的任务,但数据分析的概念及其对企业的重要性不容小觑。 为了分析数据,分析的核心部分划分为以下几个类别:
* 说明性
* 诊断性
* 预测性
* 规范性
* 认知性
### 描述性分析
描述性分析有助于根据历史数据回答有关发生了什么的问题。 描述性分析技术汇总了大型数据集,向利益干系人描述结果。
通过开发关键绩效指标 (KPI),这些策略有助于跟踪关键目标的成功或失败情况。 许多行业都使用了投资回报率 (ROI) 等指标,某些行业还开发了专门用于跟踪性能的指标。
描述性分析的示例包括生成报表来提供组织销售和财务数据的视图。
### 诊断分析
诊断分析有助于解答事件发生原因相关问题。 诊断分析技术是对基本描述性分析的补充,通过使用描述性分析的结果来发现这些事件发生的原因。 然后,进一步调查绩效指标,以发现这些事件变得更好或更糟的原因。 此过程通常分为三个步骤:
1. 确定数据中的异常。 这些异常可能是指标或特定市场中发生的意外变化。
2. 收集与这些异常相关的数据。
3. 使用统计技术来发现用以解释这些异常的关系和趋势。
### 预测分析
预测分析有助于回答有关将来会发生什么的问题。 预测分析技术使用历史数据来确定趋势并确定它们是否有可能重复出现。 预测分析工具提供将来可能发生什么的有价值见解。 技术包括各种统计和机器学习技术,例如神经网络、决策树和回归。
### 规范性分析
规范性分析有助于回答应采取哪些措施来实现目标的问题。 通过使用来自预测分析的见解,组织可基于数据制定决策。 此方法允许企业在面临不确定性时做出明智的决策。 规范性分析技术依赖机器学习策略来找出大型数据集中的模式。 通过分析过去的决策和事件,组织可以估计不同结果的可能性。
### 认知分析
认知分析尝试从现有数据和模式中进行推断,并基于现有知识库得出结论,然后将这些结果添加回知识库,以供将来进行推断,这是一个自学习反馈循环。 认知分析有助于了解如果情况发生变化可能发生什么,以及确定如何处理这些情况。
推断不是基于规则数据库的结构化查询,而是从多个源收集的非结构化假设,并以不同的置信度表示。 有效的认知分析取决于机器学习算法,并使用多种自然语言处理概念来利用以前未使用过的数据源,例如呼叫中心对话日志和产品评审。