ThinkChat2.0新版上线,更智能更精彩,支持会话、画图、阅读、搜索等,送10W Token,即刻开启你的AI之旅 广告
在处理大规模数据集时,在开发和修改查询的阶段,如果能在数据集的一小部分数据上试运行查询,会带来很多方便。 <br/> ```sql # 分桶抽样基本语法 select * from table_name tablesample(bucket x out of y on param) s; -- x:要从第x个分桶开始查询,x <= y; -- y:抽样比例,比如分桶总数为4,y=2,则抽取y=4/2=2个分桶; 如果分桶总数为4,y=8,则抽取y=4/8=1/2个分桶; 注意:y必须是分桶总数的倍数或因子。 -- param:可以是分桶表的一列或多列,或者是一个有返回值的函数,比如随机函数rand() -- s:表的别名 #### #### select * from bucket_4 tablesample(bucket 2 out of 8) s; #### 根据id列查询 ##### select * from bucket_4 tablesample(bucket 2 out of 48 on id) s; #### 根据整行随机抽样 #### select * from bucket_4 tablesample(bucket 2 out of 48 on rand()) s; ```