DataFrame是什么 · Hadoop2.x

* DataFrame （Spark 1.4+） * DataFrame是Dataset[Row]的别名，类似传统数据的二维表格 * 在RDD基础上加入了Schema（数据结构信息） * DataFrame Schema支持嵌套数据类型 * struct * map * array * 提供更多类似SQL操作的API DataFrame 可以通过：结构化的数据文件、现有 RDD、Hive 表、外部数据库来创建。