set hive.cli.print.current.db=true;
创建表
CREATE TABLE sales(
name STRING,
amount INT,
region STRING)
row format delimited
fields terminated by ',';
插入语句
~~~
INSERT INTO TINSERT INTO TABLE sales VALUES("ljs",100,"beijing");
INSERT INTO TINSERT INTO TABLE sales VALUES("zhangs",10,"shanghai");
INSERT INTO TABLE sales VALUES("zhoug",8,"liaoning");
~~~
执行SQL语句后,数据存储在dhfs /hive/warehouse
创建集合类型的表
~~~
create table employees(
name string,
salary float,
subordinates array<string>,
deductions map<string,float>,
address struct<street:string,city:string,state:string,zip:int>)
row format delimited
fields terminated by '\001'
collection items terminated by '\002'
map keys terminated by '\003'
lines terminated by '\n'
stored as textfile;
~~~
桶表—介绍桶表
~~~
CREATE TABLE bucketed_users(
UserID Int,
Gender string,
Age Int,
Occupation string,
Zipcode string)
CLUSTERED BY (UserID) INTO 4 BUCKETS
ROW FORMAT DELIMITED
FIELDS TERMINATED BY ',';
~~~
要向分桶表中填充成员,需要将 hive.enforce.bucketing 属性设置为 true,Hive 就知道用表定义中声明的数量来创建桶。
~~~
hive>set hive.enforce.bucketing = true;
~~~
插入数据
~~~
INSERT OVERWRITE TABLE bucketed_users
SELECT UserID,Gender, Age,Occupation,Zipcode
FROM users;
~~~
每个桶在磁盘上对应一个文件。
- 空白目录
- 第一章 Linux虚拟机安装
- 第二章 SSH配置
- 第三章 jdk配置
- 第四章 Hadoop配置-单机
- 第五章 Hadoop配置-集群
- 第六章 HDFS
- 第七章 MapReduce
- 7.1 MapReduce(上)
- 7.2 MapReduce(下)
- 7.3 MapReduce实验1 去重
- 7.4 MapReduce实验2 单例排序
- 7.5 MapReduce实验3 TopK
- 7.6 MapReduce实验4 倒排索引
- 第八章 Hive
- Hive安装
- 数据定义
- 数据操作
- 第九章 HBase
- 第十章 SaCa RealRec数据科学平台
- 第十一章 Spark Core
- 第十二章 Spark Streaming
- 第十章 Spark测试题