企业🤖AI智能体构建引擎,智能编排和调试,一键部署,支持私有化部署方案 广告
* DStream离散数据流(Discretized Stream)是Spark Streaming提供的高级别抽象数据流。它表示连续的数据流,可以是从源接收到的输入数据流,也可以是通过转换输入流生成的经过处理的数据流。 * DStream代表了一系列连续的RDDs * 每个RDD都包含一个时间间隔内的数据 * DStream既是输入的数据流,也是转换处理过的数据流 * 对DStream的转换操作即是对具体RDD操作 :-: ![](https://img.kancloud.cn/c7/4a/c74a742f3d09363cf664e298f92f3899_831x128.png) DStream与RDD的关系 <br/> 一个WordCount案例的DStream转换过程如下: :-: ![](https://img.kancloud.cn/84/2e/842e87113f6945ce63c2e5472ec70d2c_722x500.png) DStream转换