### 11.1 实验目的
1. 学会创建Hive的表;
2. 显示Hive中的所有表;
3. 显示Hive中表的列项;
4. 修改Hive中的表并能够删除Hive中的表。
### 11.2 实验要求
1. 要求实验结束时;
2. 每位学生均能够完成Hive的DDL操作;
3. 能够在Hive中新建,显示,修改和删除表等功能。
### 11.3 实验原理
Hive没有专门的数据存储格式,也没有为数据建立索引,用户可以非常自由的组织 Hive中的表,只需要在创建表的时候告诉Hive数据中的列分隔符和行分隔符,Hive就可以解析数据。
Hive中所有的数据都存储在HDFS中,Hive中包含以下数据模型:表(Table),外部表(External Table),分区(Partition),桶(Bucket)。
Hive中Table和数据库中 Table在概念上是类似的,每一个Table在Hive中都有一个相应的目录存储数据。例如,一个表 pvs,它在 HDFS 中的路径为:/wh/pvs,其中,wh 是在hive-site.xml中由${hive.metastore.warehouse.dir}指定的数据仓库的目录,所有的 Table 数据(不包括 External Table)都保存在这个目录中。
### 11.4 实验步骤
#### 11.4.1 启动Hive
启动Hive命令行。
~~~
[root@client ~]# cd /usr/cstor/hive/
[root@client hive ]# bin/hive
~~~
#### 11.4.2 创建表
默认情况下,新建表的存储格式均为Text类型,字段间默认分隔符为键盘上的Tab键。
创建一个有两个字段的pokes表,其中第一列名为foo,数据类型为INT,第二列名为bar,类型为STRING。
~~~
hive> CREATE TABLE pokes (foo INT, bar STRING) ;
~~~
创建一个有两个实体列和一个(虚拟)分区字段的invites表。
~~~
hive> CREATE TABLE invites (foo INT, bar STRING) PARTITIONED BY (ds STRING) ;
~~~
注意:分区字段并不属于invites,当向invites导入数据时,ds字段会用来过滤导入的数据。
#### 11.4.3 显示表
显示所有的表。
~~~
hive> SHOW TABLES ;
~~~
显示表(正则查询),同MySQL中操作一样,Hive也支持正则查询,比如显示以.s结尾的表。
~~~
hive> SHOW TABLES '.*s';
~~~
#### 11.4.4 显示表列
~~~
hive> DESCRIBE invites;
~~~
#### 11.4.5 更改表
修改表events名为3koobecaf (自行创建任意类型events表):
~~~
hive> ALTER TABLE events RENAME TO 3koobecaf;
~~~
将pokes表新增一列(列名为new_col,类型为INT):
~~~
hive> ALTER TABLE pokes ADD COLUMNS (new_col INT);
~~~
将invites表新增一列(列名为new_col2,类型为INT),同时增加注释“a comment”:
~~~
hive> ALTER TABLE invites ADD COLUMNS (new_col2 INT COMMENT 'a comment');
~~~
替换invites表所有列名(数据不动):
~~~
hive> ALTER TABLE invites REPLACE COLUMNS (foo INT, bar STRING, baz INT COMMENT 'baz replaces new_col2');
~~~
#### 11.4.6 删除表(或列)
删除invites表bar 和 baz 两列:
~~~
hive> ALTER TABLE invites REPLACE COLUMNS (foo INT COMMENT 'only keep the first column');
~~~
删除pokes表:
~~~
hive> DROP TABLE pokes;
~~~
### 11.5 实验结果
上述实验步骤的结果如下图所示:
创建一个有两个字段的pokes表,如图11-1所示。
![](https://box.kancloud.cn/18d4d29926280f8416211164cd921d7a_306x53.jpg)
图11-1
创建一个有两个实体列和一个(虚拟)分区字段的invites表,如图11-2所示。
![](https://box.kancloud.cn/fe68df5d0c34e83f13a036d04c5e66fa_486x56.jpg)
图11-2
显示所有的表,如图10-3所示。
![](https://box.kancloud.cn/882f8d99e8e80628490f275553b2ac40_281x81.jpg)
图11-3
以.s结尾的表,如图11-4所示。
![](https://box.kancloud.cn/e72011bd8011f8e3163f9bd3bd7e2ea7_287x82.jpg)
图11-4
显示表列,如图11-5所示。
![](https://box.kancloud.cn/aed78a35248fff5c5b584bb3f31a8983_382x178.jpg)
图11-5
修改表events名为3koobecaf (自行创建任意类型events表),如图11-6所示。
![](https://box.kancloud.cn/661fd387248bbafdf4047f613d297614_299x55.jpg)
图11-6
将pokes表新增一列(列名为new_col,类型为INT),如图11-7所示。
![](https://box.kancloud.cn/b2d38dd1ef7d0e8aab4c7a4b128004c7_327x55.jpg)
图11-7
将invites表新增一列(列名为new_col2,类型为INT),如图11-8所示。
![](https://box.kancloud.cn/daae78f41c8767a98ed4d062fbbbff9c_487x56.jpg)
图11-8
替换invites表所有列名,如图11-9所示。
![](https://box.kancloud.cn/e71731d7bd40a63152f545b0f4a493f3_479x37.jpg)
图11-9
删除invites表bar 和 baz 两列,如图11-10所示。
![](https://box.kancloud.cn/e7b7bc67e19adfd146f6811431f7b971_478x46.jpg)
图11-10
删除pokes表,如图11-11所示。
![](https://box.kancloud.cn/b99fdbd5a87d85ccfdefe285a7c6d5a7_188x59.jpg)
- GitHub---资源收集
- 【GitHub】收录总榜单
- 【Office & Markdown & PDF】资源收集
- 【前端】资源收集
- 【开源项目】资源收集
- 【代码备份】资源收集
- 【代码加密】资源收集
- 【好文章推荐】资源收集
- GitHub---实践方案
- 【Laradock】实践方案
- 【开发规范】实践方案
- 【laravel-snappy】实践方案
- 【队列---Laravel-Horizon 】实践方案
- 【检索---Elasticsearch】实践方案---简单了解
- 【Laravel-admin】实践方案
- 技术选型
- 技术选型结果
- PHP开发流程
- Laravel自带异常
- 技术选型问题 & 解决方法
- 修改(Admin)文件夹路径
- 两个用户表合并
- 创建Token,获取接口数据
- CreateFreshApiToken中间件使用
- Generator从表生成文件,不包括迁移文件
- 添加用户的同时生产令牌
- 其它参考文章
- Laravel-admin常见问题
- form(),show()获取对象数据
- Form右上角按钮重写
- form回调中的错误提醒,回调传参
- 【小工具类】实践方案
- 字符串
- 数组
- 无限级分类递归
- 时间
- 正则表达式
- 文件
- 经纬度、时区
- DataEdit快捷操作类库
- 数据库表结构管理
- 【Guzzle】实践方案---工具类
- Java---大数据在线实验
- 基础实验操作
- 【一】基础操作实验
- HDFS
- 【二】部署HDFS
- 【三】读写HDFS文件
- YARN
- 【四】部署YARN集群
- MapReduce
- 【五】单词计数
- Hive
- 【十】部署Hive
- 【十一】新建Hive表
- 【十二】Hive分区
- ZooKeeper
- 【二十】部署ZooKeeper
- 【二十一】进程协作
- HBase
- 【二十二】部署HBase
- 【二十三】新建HBase表
- Storm
- 【二十四】部署Storm
- 【二十五】实时WordCountTopology
- Kafka
- 【二十七】Kafka订阅推送示例
- Redis
- 【二十九】Redis部署与简单使用
- 【三十】MapReduce与Spark读写Redis
- MongoDB
- 【三十一】读写MongoDB
- MySQL
- 关于最重要的参数选项调整建议
- 索引,Explain优化工具
- 事务级别
- sql好的书写习惯
- limit(分页)
- 赶集网Mysql36条军规
- 分库分表技术演进&最佳实践
- MariaDB 和 MySQL 全面对比
- 永远不要在 MySQL 中使用“utf8”
- 看云--推荐的Mysql优化
- 完整、详细的MySQL规范
- 慢查询日志
- pt-query-digest结果分析
- Redis
- 看云-推荐的redis学习
- Memcache和Redis不同
- 阿里云Redis开发规范
- Centos7
- 虚拟机配置网络
- 硬盘挂载、分区、文件大小
- 防火墙(firewalld、firewalld-cmd、systemctl、iptables)
- 两个机器互相拷贝文件
- 查进程、查端口
- 压缩、解压
- 查看物理CPU个数、CPU内核数、线程数
- apt-get源--阿里
- RAID磁盘阵列
- Docker
- Dockerfile制作常用命令
- registry私有仓库
- PHP_7.2
- Dockerfile
- php.ini
- 使用说明
- Nginx_1.15
- Dockerfile
- nginx.conf
- prod_nginx.conf
- 使用说明
- MySql_5.7
- Dockerfile
- my.cnf
- 使用说明
- redmine_3.4
- Dockerfile
- 使用说明
- gitlab-ce_11.9.6-ce.0
- 使用说明
- Redis_5.0
- Dockerfile
- redis.conf
- 使用说明
- Jenkins
- Dockerfile
- 使用说明
- webssh--python3.7
- Dockerfile
- 使用说明
- 进阶使用
- 高阶使用
- minio
- 使用说明
- aws_cloud9_ide
- 使用说明
- VNC
- 使用说明
- jdk1.8——yum安装
- tomcat9——安装
- guacamole——0.9.13
- libreoffice
- Dockerfile
- 使用说明
- Kubernetes
- kubectl常用命令
- 环境搭建(1.9.6)
- kubernetes1.9.6墙内离线部署
- kubernetes1.9.6单机器部署
- helm安装
- helm常用命令
- Swoole
- 环境的搭建
- swoole的简单实例
- 服务端的cli方式运行
- 客户端的运行方式
- 定时任务的入门
- 删除定时任务
- 初始化定时任务
- 日志管理
- 具体任务的异常捕获
- 手动重启shell脚本
- 阅读感受
- 【读书】登天的感觉——岳晓东
- 【读书】为何家会伤人——武志红
- 【感受】箭扣,一次就好
- 【读书】思考与致富——拿破仑-希尔
- 【感受】做事讲方法
- 【感受】未来畅想
- 【素材】智力问答
- 【百家】曾国藩家训
- 【百家】正说和珅
- 【感受】谈判小技巧
- 【读书】股票作手回忆录——利弗莫尔
- 【感受】最幸福的人——工匠
- 【收藏】土味情话大合集
- 【读书】解忧杂货店——东野圭吾
- 【收藏】家乡名人
- 【读书】把时间当作朋友——李笑来
- 【感受】舆论和八卦
- 【读书】老人与海——海明威
- 【读书】必然——凯文凯利
- 【经典】逍遥游——庄周
- Git+PHPStorm+Composer
- Git命令
- .gitignore忽略规则
- PHPStorm第一次使用
- PHPStorm关联gitlab
- Composer修改镜像源
- Xdebug
- PHP进阶
- 缓存在高并发场景下的常见问题
- 一、缓存一致性问题
- 二、缓存并发问题
- 三、缓存穿透问题
- 四、缓存颠簸问题
- 五、缓存的雪崩现象
- 六、缓存无底洞现象
- Laravel源码解析(知识点)
- 闭包、IOC容器服务绑定延迟加载
- 延迟静态绑定基类
- 反射,依赖注入
- __callStatic 魔术方法,Facade 工作原理
- array_reduce,中间件解析
- Eloquent核心
- Laravel框架加载流程
- 线程、进程、协程
- Linux进程、线程、协程
- poll、epoll
- epoll原理
- Liunx线程调度算法
- 红黑树
- 同步/异步、阻塞/非阻塞
- PHP-FPM
- Nginx
- Swoole
- Go
- 惊群问题
- 线程模型比较
- 并发模型比较
- Lua
- OpenResty
- 数据一致性
- 悲观锁--VS--乐观锁
- 事务--mysql VS redis
- 事务嵌套--Doctrine VS Laravel
- 单体应用中执行顺序问题
- 数据一致性问题描述
- 分布式理论
- 数据一致性---接口幂等性
- 分布式事务---2PC VS 3PC
- 分布式事务---TCC
- 分布式事务---基于消息
- 接口安全性
- PHP & Nginx
- 请求超时问题
- 两者之间的通信原理
- TCP三次握手
- Nginx常用优化
- PHP数组底层原理
- PHP排序函数sort底层原理
- PHP函数---trim()
- 树形数据在关系型库中存储
- 标签(Tag)的各种设计