ThinkChat2.0新版上线,更智能更精彩,支持会话、画图、阅读、搜索等,送10W Token,即刻开启你的AI之旅 广告
Spark SQL 是 Spark 用来处理结构化数据的一个模块,它提供了一个编程抽象数据结构叫做 DataFrame 并且作为分布式 SQL 查询引擎的作用。 <br/> Hive,它是将 Hive SQL 转换成 MapReduce 然后提交到集群上执行,大大简化了编写 MapReduce 的程序的复杂性 ,由于MapReduce 这种计算模型执行效率比较慢。所有 Spark SQL 的应运而生,它是将 Spark SQL 转换成 RDD,然后提交到集群执行,执行效率非常快! <br/> SparkSQL特点:易整合、统一的数据访问方式、兼容 Hive、标准的数据连接。