# 数据科学
> 原文: [https://pythonbasics.org/data-science/](https://pythonbasics.org/data-science/)
数据科学是科学地从各种结构化和非结构化数据中提取知识的过程。 它是一个多学科领域,使用不同种类的算法和技术来识别数据的真实目的和含义。
数据科学家需要具备高超的技术才能解释数据并提取含义。 数据科学家需要成为各种数据科学工具的专家,例如分析工具,数据可视化工具,数据库工具和其他工具。 数据科学包括以下组件,数据分析&:
## 数据科学
### 探索数据
数据科学主要从探索和分析开始。 数据科学家探索数据并将其处理到微观层次。
在开始数据分析之前,将识别具有不同数据集的常见数据并进行分类。 KNIME,OpenRefin,Orange,RapidMiner,Pentaho,Talend 是用于此类工作的一些数据探索和数据分析工具。
### 数据可视化
数据科学中的可视化意味着通过各种可视内容以更容易理解的方式呈现数据。
这主要是针对不了解数据技术表示形式的普通读者完成的。 数据的可视化对于将数据呈现给最终用户非常有效。
一些数据可视化工具是 Tableau,Infogram,ChartBlocks,Datawrapper,Plotly,RAW,Visual.ly 等。
### 经典机器学习
在数据科学中,计算机本身学习如何使用不同的算法和统计信息来计算不同的数据。
该技术非常耗时且复杂。 但是随着时间的流逝,它现在变得越来越快。
这些类型的计算称为机器学习或人工智能。
它无需程序员的帮助即可自动从工作和系统中学习。 这些类型的软件应用程序根据其计算经验进行学习。
一些机器学习工具包括 Google ML Kit,OpenNN,Apache Mahout,HPE Haven OnDemand,HPE Haven OnDemand 等。
### 深度学习
深度学习或深度学习实际上是机器学习的一部分。 它基于数据表示和算法。
这种深度学习技术对于数据科学至关重要。 ylearn2,Theano,Caffe,Torch,Cuda-convent,Deeplearning4j 这些是用于数据科学中深度学习的一些工具。
### 数据存储和大数据框架
数据是数据科学过程的核心和主要组成部分。 公司将数据存储在大型基础架构中,并为存储的数据设置不同的框架。
所有数据都以井井有条的方式存储,因此用户可以轻松访问和处理数据。 它使数据科学家可以轻松地分析,探索,访问和处理海量数据。
![big data](https://img.kancloud.cn/b2/4d/b24dcb637dc3efc5398751e667d03587_1160x790.jpg)
### 总结
如今,对数据科学的最初威胁是难以阅读某些自然语言,数据处理和图像处理。
尽管开发了各种应用程序和软件来限制这些威胁,但仍出现了新问题。
数据科学是计算机科学中的下一件大事。 对新数据科学家的需求正在迅速扩展,并且该行业正在迅速发展。
- 介绍
- 学习 python 的 7 个理由
- 为什么 Python 很棒
- 学习 Python
- 入门
- 执行 Python 脚本
- 变量
- 字符串
- 字符串替换
- 字符串连接
- 字符串查找
- 分割
- 随机数
- 键盘输入
- 控制结构
- if语句
- for循环
- while循环
- 数据与操作
- 函数
- 列表
- 列表操作
- 排序列表
- range函数
- 字典
- 读取文件
- 写入文件
- 嵌套循环
- 切片
- 多个返回值
- 作用域
- 时间和日期
- try except
- 如何使用pip和 pypi
- 面向对象
- 类
- 构造函数
- 获取器和设置器
- 模块
- 继承
- 静态方法
- 可迭代对象
- Python 类方法
- 多重继承
- 高级
- 虚拟环境
- 枚举
- Pickle
- 正则表达式
- JSON 和 python
- python 读取 json 文件
- 装饰器
- 网络服务器
- 音频
- 用 Python 播放声音
- python 文字转语音
- 将 MP3 转换为 WAV
- 转录音频
- Tkinter
- Tkinter
- Tkinter 按钮
- Tkinter 菜单
- Tkinter 标签
- Tkinter 图片
- Tkinter 画布
- Tkinter 复选框
- Tkinter 输入框
- Tkinter 文件对话框
- Tkinter 框架
- Tkinter 列表框
- Tkinter 消息框
- Tkinter 单选按钮
- Tkinter 刻度
- 绘图
- Matplotlib 条形图
- Matplotlib 折线图
- Seaborn 分布图
- Seaborn 绘图
- Seaborn 箱形图
- Seaborn 热力图
- Seaborn 直线图
- Seaborn 成对图
- Seaborn 调色板
- Seaborn Pandas
- Seaborn 散点图
- Plotly
- PyQt
- PyQt
- 安装 PyQt
- PyQt Hello World
- PyQt 按钮
- PyQt QMessageBox
- PyQt 网格
- QLineEdit
- PyQT QPixmap
- PyQt 组合框
- QCheckBox
- QSlider
- 进度条
- PyQt 表格
- QVBoxLayout
- PyQt 样式
- 编译 PyQt 到 EXE
- QDial
- QCheckBox
- PyQt 单选按钮
- PyQt 分组框
- PyQt 工具提示
- PyQt 工具箱
- PyQt 工具栏
- PyQt 菜单栏
- PyQt 标签小部件
- PyQt 自动补全
- PyQt 列表框
- PyQt 输入对话框
- Qt Designer Python
- 机器学习
- 数据科学
- 如何从机器学习和 AI 认真地起步
- 为什么要使用 Python 进行机器学习?
- 机器学习库
- 什么是机器学习?
- 区分机器学习,深度学习和 AI?
- 机器学习
- 机器学习算法比较
- 为什么要使用 Scikit-Learn?
- 如何在 Python 中加载机器学习数据
- 机器学习分类器
- 机器学习回归
- Python 中的多项式回归
- 决策树
- k 最近邻
- 训练测试拆分
- 人脸检测
- 如何为 scikit-learn 机器学习准备数据
- Selenium
- Selenium 浏览器
- Selenium Cookie
- Selenium 执行 JavaScript
- Selenium 按 ID 查找元素
- Selenium 无头 Firefox
- Selenium Firefox
- Selenium 获取 HTML
- Selenium 键盘
- Selenium 最大化
- Selenium 截图
- Selenium 向下滚动
- Selenium 切换到窗口
- Selenium 等待页面加载
- Flask 教程
- Flask 教程:Hello World
- Flask 教程:模板
- Flask 教程:路由