🔥码云GVP开源项目 12k star Uniapp+ElementUI 功能强大 支持多语言、二开方便! 广告
# 编程指南 * [概述](#概述) * [Spark 依赖](#spark-依赖) * [初始化 Spark](#初始化-spark) * [使用 Shell](#使用-shell) * [弹性分布式数据集(RDDs)](#弹性分布式数据集-rdds) * [并行集合](#并行集合) * [外部 Datasets(数据集)](#外部-datasets数据集) * [RDD 操作](#rdd-操作) * [基础](#基础) * [传递 Functions(函数)给 Spark](#传递-functions函数给-spark) * [理解闭包](#理解闭包-) * [示例](#示例) * [Local(本地)vs. cluster(集群)模式](#local本地vs-cluster集群模式) * [打印 RDD 的 elements](#打印-rdd-的-elements) * [与 Key-Value Pairs 一起使用](#与--key-value-pairs-一起使用) * [Transformations(转换)](#transformations转换) * [Actions(动作)](#actions动作) * [Shuffle 操作](#shuffle-操作) * [Background(幕后)](#background幕后) * [性能影响](#性能影响) * [RDD Persistence(持久化)](#rdd-persistence持久化) * [如何选择存储级别 ?](#如何选择存储级别-) * [删除数据](#删除数据) * [共享变量](#共享变量) * [广播变量](#广播变量) * [Accumulators(累加器)](#accumulators累加器) * [部署应用到集群中](#部署应用到集群中) * [从 Java / Scala 启动 Spark jobs](#从-java--scala-启动-spark-jobs) * [单元测试](#单元测试) * [快速链接](#快速链接)