🔥码云GVP开源项目 12k star Uniapp+ElementUI 功能强大 支持多语言、二开方便! 广告
```scala /** *ds.agg(...)是 ds.groupBy().agg(...)的简写。 */ def agg(expr: Column, exprs: Column*): DataFrame //示例 ds.agg(max($"age"), avg($"salary")) ds.groupBy().agg(max($"age"), avg($"salary")) def agg(exprs: Map[String, String]): DataFrame def agg(aggExpr: (String, String), aggExprs: (String, String)*): DataFrame //示例 ds.agg(Map("age" -> "max", "salary" -> "avg")) //等价于 ds.groupBy().agg(Map("age" -> "max", "salary" -> "avg")) /** *根据列名选择列并将其作为列返回。 */ def apply(colName: String): Column def col(colName: String): Column def colRegex(colName: String): Column //指定列名前缀 /** *笛卡尔积。 */ def crossJoin(right: Dataset[_]): DataFrame /** *使用指定的列为当前数据集创建多维数据集,以便在其上运行聚合。 */ def cube(col1: String, cols: String*): RelationalGroupedDataset def cube(cols: Column*): RelationalGroupedDataset /** *删除列。 * def drop(col: Column): DataFrame def drop(colNames: String*): DataFrame def drop(colName: String): DataFrame /** *分组 */ def groupBy(col1: String, cols: String*): RelationalGroupedDataset def groupBy(cols: Column*): RelationalGroupedDataset /** *表连接。 */ def join(right: Dataset[_], joinExprs: Column, joinType: String): DataFrame def join(right: Dataset[_], joinExprs: Column): DataFrame def join(right: Dataset[_], usingColumns: Seq[String], joinType: String) : DataFrame def join(right: Dataset[_], usingColumns: Seq[String]): DataFrame def join(right: Dataset[_], usingColumn: String): DataFrame def join(right: Dataset[_]): DataFrame /** *返回一个处理丢失数据的 DataFrameNaFunctions。 */ def na: DataFrameNaFunctions //示例 df.na.drop()//删除包含空值的行 /** *使用指定的列为当前数据集创建多维汇总,以便在其上运行聚合。 */ def rollup(col1: String, cols: String*): RelationalGroupedDataset def rollup(cols: Column*): RelationalGroupedDataset /** *基于列的表达式选择一个 Dataset。 */ def select(col: String, cols: String*): DataFrame def select(cols: Column*): DataFrame /** *这是 select 的一个变体,它接受 SQL 表达式。 */ def selectExpr(exprs: String*): DataFrame // 以下是等价的: ds.selectExpr("colA", "colB as newName", "abs(colC)") ds.select(expr("colA"), expr("colB as newName"), expr("abs(colC)")) /** *对统计的支持。 */ def stat: DataFrameStatFunctions //示例 ds.stat.freqItems(Seq("a")) //在名称为 a 的列中查找频繁项 /** *通过添加列或替换具有相同名称的现有列来返回新数据集。 */ def withColumn(colName: String, col: Column): DataFrame def withColumnRenamed(existingName: String, newName: String): DataFrame ```