# 编程指南
* [概述](#概述)
* [Spark 依赖](#spark-依赖)
* [初始化 Spark](#初始化-spark)
* [使用 Shell](#使用-shell)
* [弹性分布式数据集(RDDs)](#弹性分布式数据集-rdds)
* [并行集合](#并行集合)
* [外部 Datasets(数据集)](#外部-datasets数据集)
* [RDD 操作](#rdd-操作)
* [基础](#基础)
* [传递 Functions(函数)给 Spark](#传递-functions函数给-spark)
* [理解闭包](#理解闭包-)
* [示例](#示例)
* [Local(本地)vs. cluster(集群)模式](#local本地vs-cluster集群模式)
* [打印 RDD 的 elements](#打印-rdd-的-elements)
* [与 Key-Value Pairs 一起使用](#与--key-value-pairs-一起使用)
* [Transformations(转换)](#transformations转换)
* [Actions(动作)](#actions动作)
* [Shuffle 操作](#shuffle-操作)
* [Background(幕后)](#background幕后)
* [性能影响](#性能影响)
* [RDD Persistence(持久化)](#rdd-persistence持久化)
* [如何选择存储级别 ?](#如何选择存储级别-)
* [删除数据](#删除数据)
* [共享变量](#共享变量)
* [广播变量](#广播变量)
* [Accumulators(累加器)](#accumulators累加器)
* [部署应用到集群中](#部署应用到集群中)
* [从 Java / Scala 启动 Spark jobs](#从-java--scala-启动-spark-jobs)
* [单元测试](#单元测试)
* [快速链接](#快速链接)
- Spark 概述
- 编程指南
- 快速入门
- Spark 编程指南
- 构建在 Spark 之上的模块
- Spark Streaming 编程指南
- Spark SQL, DataFrames and Datasets Guide
- MLlib
- GraphX Programming Guide
- API 文档
- 部署指南
- 集群模式概述
- Submitting Applications
- 部署模式
- Spark Standalone Mode
- 在 Mesos 上运行 Spark
- Running Spark on YARN
- 其它
- 更多
- Spark 配置
- Monitoring and Instrumentation
- Tuning Spark
- 作业调度
- Spark 安全
- 硬件配置
- Accessing OpenStack Swift from Spark
- 构建 Spark
- 其它
- 外部资源
- Spark RDD(Resilient Distributed Datasets)论文
- 翻译进度