企业🤖AI智能体构建引擎,智能编排和调试,一键部署,支持私有化部署方案 广告
[TOC] 内容较多,见《Hive官方文档》 ~~~ show functions; ~~~ # 关系运算 Hive支持的关系运算符 常见的关系运算符 ~~~ 等值比较: = 不等值比较: <> 小于比较: < 小于等于比较: <= 大于比较: > 大于等于比较: >= 空值判断: IS NULL 非空判断: IS NOT NULL LIKE比较: LIKE JAVA的LIKE操作: RLIKE REGEXP操作: REGEXP 等值比较: = ~~~ **语法:A=B** 操作类型:所有基本类型 描述: 如果表达式A与表达式B相等,则为TRUE;否则为FALSE 举例: ~~~ hive> select 1 from dual where 1=1; ~~~ **不等值比较: `<>`** 语法: `A <> B` 操作类型: 所有基本类型 描述: 如果表达式A为NULL,或者表达式B为NULL,返回NULL;如果表达式A与表达式B不相等,则为TRUE;否则为FALSE 举例: ~~~ hive> select 1 from dual where 1 <> 2; ~~~ **小于比较: <** 语法:` A < B` 操作类型: 所有基本类型 描述: 如果表达式A为NULL,或者表达式B为NULL,返回NULL;如果表达式A小于表达式B,则为TRUE;否则为FALSE 举例: ~~~ hive> select 1 from dual where 1 < 2; ~~~ **小于等于比较: `<=`** 语法: `A <= B` 操作类型: 所有基本类型 描述: 如果表达式A为NULL,或者表达式B为NULL,返回NULL;如果表达式A小于或者等于表达式B,则为TRUE;否则为FALSE 举例: ~~~ hive> select 1 from dual where 1 <= 1; ~~~ **大于等于比较: `>=`** 语法: `A >= B` 操作类型: 所有基本类型 描述: 如果表达式A为NULL,或者表达式B为NULL,返回NULL;如果表达式A大于或者等于表达式B,则为TRUE;否则为FALSE 举例: ~~~ hive> select 1 from dual where 1 >= 1; ~~~ **空值判断: IS NULL** 语法: A IS NULL 操作类型: 所有类型 描述: 如果表达式A的值为NULL,则为TRUE;否则为FALSE 举例: ~~~ hive> select 1 from dual where null is null; ~~~ **非空判断: IS NOT NULL** 语法: A IS NOT NULL 操作类型: 所有类型 描述: 如果表达式A的值为NULL,则为FALSE;否则为TRUE 举例: ~~~ hive> select 1 from dual where 1 is not null; ~~~ **LIKE比较: LIKE** 语法: A LIKE B 操作类型: strings 描述: 如果字符串A或者字符串B为NULL,则返回NULL;如果字符串A符合表达式B 的正则语法,则为TRUE;否则为FALSE。B中字符`"_"`表示任意单个字符,而字符`”%”`表示任意数量的字符。 举例: ~~~ hive> select 1 from dual where 'key' like 'foot%'; 1 hive> select 1 from dual where 'key ' like 'foot____'; 1 ~~~ 注意:否定比较时候用 NOT A LIKE B ~~~ hive> select 1 from dual where NOT 'key ' like 'fff%'; ~~~ **JAVA的LIKE操作: RLIKE** 语法: A RLIKE B 操作类型: strings 描述: 如果字符串A或者字符串B为NULL,则返回NULL;如果字符串A符合JAVA正则表达式B的**正则语法**,则为TRUE;否则为FALSE。 举例: ~~~ hive> select 1 from dual where 'footbar' rlike '^f.*r$’; 1 ~~~ 注意:判断一个字符串是否全为数字: ~~~ hive>select 1 from dual where '123456' rlike '^\\d+$'; 1 hive> select 1 from dual where '123456aa' rlike '^\\d+$'; 1 ~~~ **REGEXP操作: REGEXP** 语法: A REGEXP B 操作类型: strings 描述: 功能与RLIKE相同 举例: ~~~ hive> select 1 from dual where 'key' REGEXP '^f.*r$'; 1 ~~~ # 逻辑运算与数学运算 ## Hive数学运算 加法操作: + 减法操作: - 乘法操作: * 除法操作: / 取余操作: % 位与操作: & 位或操作: | 位异或操作: ^ 位取反操作: ~ 加法操作: + **语法: A + B** 操作类型:所有数值类型 说明:返回A与B相加的结果。结果的数值类型等于A的类型和B的类型的最小父类型(详见数据类型的继承关系)。比如,int + int 一般结果为int类型,而int + double 一般结果为double类型 举例: ~~~ hive> select 1 + 9 from dual; 10 ~~~ **减法操作: -** 语法: A - B 操作类型:所有数值类型 说明:返回A与B相减的结果。结果的数值类型等于A的类型和B的类型的最小父类型(详见数据类型的继承关系)。比如,int - int 一般结果为int类型,而int - double 一般结果为double类型 举例: ~~~ hive> select 10 - 5 from dual; 5 ~~~ **`乘法操作 : *`** 语法: `A * B` 操作类型:所有数值类型 说明:返回A与B相乘的结果。结果的数值类型等于A的类型和B的类型的最小父类型(详见数据类型的继承关系)。注意,如果A乘以B的结果超过默认结果类型的数值范围,则需要通过cast将结果转换成范围更大的数值类型 举例: ~~~ hive> select 40 * 5 from dual; 200 ~~~ **除法操作 : /** 语法: A / B 操作类型:所有数值类型 说明:返回A除以B的结果。结果的数值类型为double 举例: ~~~ hive> select 40 / 5 from dual; 8.0 ~~~ 注意: hive 中最高精度的数据类型是 double, 只精确到小数点后 16 位,在做除法运算的时候要 特别注意 ~~~ hive>select ceil(28.0/6.999999999999999999999) from dual limit 1; 结果为4 hive>select ceil(28.0/6.99999999999999) from dual limit 1; 结果为5 ~~~ **取余操作 : %** 语法: `A % B` 操作类型:所有数值类型 说明:返回A除以B的余数。结果的数值类型等于A的类型和B的类型的最小父类型(详见数据类型的继承关系)。 举例: ~~~ hive> select 41 % 5 from dual; 1 hive> select 8.4 % 4 from dual; 0.40000000000000036 ~~~ 注意:精度在 hive 中是个很大的问题,类似这样的操作最好通过 round 指定精度 ~~~ hive> select round(8.4 % 4 , 2) from dual; 0.4 ~~~ **位与操作 : &** 语法: `A & B` 操作类型:所有数值类型 说明:返回A和B按位进行与操作的结果。结果的数值类型等于A的类型和B的类型的最小父类型(详见数据类型的继承关系)。 举例: ~~~ hive> select 4 & 8 from dual; 0 hive> select 6 & 4 from dual; 4 ~~~ **位或操作 : |** 语法: A | B 操作类型:所有数值类型 说明:返回A和B按位进行或操作的结果。结果的数值类型等于A的类型和B的类型的最小父类型(详见数据类型的继承关系)。 举例: ~~~ hive> select 4 | 8 from dual; 12 hive> select 6 | 8 from dual; 14 ~~~ **位异或操作 : ^** 语法: A ^ B 操作类型:所有数值类型 说明:返回A和B按位进行异或操作的结果。结果的数值类型等于A的类型和B的类型的最小父类型(详见数据类型的继承关系)。 举例: ~~~ hive> select 4 ^ 8 from dual; 12 hive> select 6 ^ 4 from dual; 2 ~~~ **位取反操作 : ~** 语法: ~A 操作类型:所有数值类型 说明:返回A按位取反操作的结果。结果的数值类型等于A的类型。 举例: ~~~ hive> select ~6 from dual; -7 hive> select ~4 from dual; -5 ~~~ ## Hive逻辑运算 逻辑与操作: AND 逻辑或操作: OR 逻辑非操作: NOT **逻辑与操作 : AND** 语法: A AND B 操作类型:boolean 说明:如果A和B均为TRUE,则为TRUE;否则为FALSE。如果A为NULL或B为NULL,则为NULL 举例: ~~~ hive> select 1 from dual where 1=1 and 2=2; 1 ~~~ **逻辑或操作 : OR** 语法: A OR B 操作类型:boolean 说明:如果A为TRUE,或者B为TRUE,或者A和B均为TRUE,则为TRUE;否则为FALSE 举例: ~~~ hive> select 1 from dual where 1=2 or 2=2; 1 ~~~ **逻辑非操作 : NOT** 语法: NOT A 操作类型:boolean 说明:如果A为FALSE,或者A为NULL,则为TRUE;否则为FALSE 举例: ~~~ hive> select 1 from dual where not 1=2; ~~~ **逻辑非操作 : NOT** 语法: NOT A 操作类型:boolean 说明:如果A为FALSE,或者A为NULL,则为TRUE;否则为FALSE 举例: ~~~ hive> select 1 from dual where not 1=2 ; ~~~ # 数值运算 取整函数: round 指定精度取整函数: round 向下取整函数: floor 向上取整函数: ceil 向上取整函数: ceiling 取随机数函数: rand 自然指数函数: exp 以10为底对数函数: log10 以2为底对数函数: log2 对数函数: log 幂运算函数: pow 幂运算函数: power 开平方函数: sqrt 二进制函数: bin 十六进制函数: hex 反转十六进制函数: unhex 进制转换函数: conv 绝对值函数: abs 正取余函数: pmod 正弦函数: sin 反正弦函数: asin 余弦函数: cos 反余弦函数: acos positive函数: positive negative函数: negative **取整函数 : round** 语法: `round(double a)` 返回值: BIGINT 说明: 返回double类型的整数值部分 (遵循四舍五入) 举例: ~~~ hive> select round(3.1415926) from dual; 3 hive> select round(3.5) from dual; 4 hive> create table dual as select round(9542.158) from dual; hive> describe dual; _c0 bigint ~~~ **指定精度取整函数 : round** 语法: `round(double a, int d)` 返回值: DOUBLE 说明: 返回指定精度d的double类型 举例: ~~~ hive> select round(3.1415926,4) from dual; 3.1416 ~~~ **向下取整函数 : floor** 语法: floor(double a) 返回值: BIGINT 说明: 返回等于或者小于该double变量的最大的整数 举例: ~~~ hive> select floor(3.1415926) from dual; 3 hive> select floor(25) from dual; 25 ~~~ **向上取整函数 : ceil** 语法: ceil(double a) 返回值: BIGINT 说明: 返回等于或者大于该double变量的最小的整数 举例: ~~~ hive> select ceil(3.1415926) from dual; 4 hive> select ceil(46) from dual; 46 ~~~ **向上取整函数 : ceiling** 语法: ceiling(double a) 返回值: BIGINT 说明: 与ceil功能相同 举例: ~~~ hive> select ceiling(3.1415926) from dual; 4 hive> select ceiling(46) from dual; 46 ~~~ **取随机数函数 : rand** 语法: rand(),rand(int seed) 返回值: double 说明: 返回一个0到1范围内的随机数。如果指定种子seed,则会等到一个稳定的随机数序列 举例: ~~~ hive> select rand() from dual; 0.5577432776034763 ~~~ **自然指数函数 : exp** 语法: exp(double a) 返回值: double 说明: 返回自然对数e的a次方 举例: ~~~ hive> select exp(2) from dual; 7.38905609893065 ~~~ **自然对数函数: ln** 语法: ln(double a) 返回值: double 说明: 返回a的自然对数 **以 10 为底对数函数 : log10** 语法: log10(double a) 返回值: double 说明: 返回以10为底的a的对数 举例: ~~~ hive> select log10(100) from dual; 2.0 ~~~ **以 2 为底对数函数 : log2** 语法: log2(double a) 返回值: double 说明: 返回以2为底的a的对数 举例: ~~~ hive> select log2(8) from dual; 3.0 ~~~ **对数函数 : log** 语法: log(double base, double a) 返回值: double 说明: 返回以base为底的a的对数 举例: ~~~ hive> select log(4,256) from dual; 4.0 ~~~ **幂运算函数 : pow** 语法: pow(double a, double p) 返回值: double 说明: 返回a的p次幂 举例: ~~~ hive> select pow(2,4) from dual; 16.0 ~~~ **幂运算函数 : power** 语法: power(double a, double p) 返回值: double 说明: 返回a的p次幂,与pow功能相同 举例: ~~~ hive> select power(2,4) from dual; 16.0 ~~~ **开平方函数 : sqrt** 语法: sqrt(double a) 返回值: double 说明: 返回a的平方根 举例: ~~~ hive> select sqrt(16) from dual; 4.0 ~~~ **二进制函数 : bin** 语法: bin(BIGINT a) 返回值: string 说明: 返回a的二进制代码表示 举例: ~~~ hive> select bin(7) from dual; 111 ~~~ **十六进制函数 : hex** 语法: hex(BIGINT a) 返回值: string 说明: 如果变量是int类型,那么返回a的十六进制表示;如果变量是string类型,则返回该字符串的十六进制表示 举例: ~~~ hive> select hex(17) from dual; 11 hive> select hex('abc') from dual; 616263 ~~~ **反转十六进制函数 : unhex** 语法: unhex(string a) 返回值: string 说明: 返回该十六进制字符串所代码的字符串 举例: ~~~ hive> select unhex('616263') from dual; abc hive> select unhex('11') from dual; - hive> select unhex(616263) from dual; abc ~~~ **进制转换函数 : conv** 语法: conv(BIGINT num, int from_base, int to_base) 返回值: string 说明: 将数值num从from_base进制转化到to_base进制 举例: ~~~ hive> select conv(17,10,16) from dual; 11 hive> select conv(17,10,2) from dual; 10001 ~~~ **绝对值函数 : abs** 语法: abs(double a) abs(int a) 返回值: double int 说明: 返回数值a的绝对值 举例: ~~~ hive> select abs(-3.9) from dual; 3.9 hive> select abs(10.9) from dual; 10.9 ~~~ **正取余函数 : pmod** 语法: pmod(int a, int b),pmod(double a, double b) 返回值: int double 说明: 返回正的a除以b的余数 举例: ~~~ hive> select pmod(9,4) from dual; 1 hive> select pmod(-9,4) from dual; 3 ~~~ **正弦函数 : sin** 语法: sin(double a) 返回值: double 说明: 返回a的正弦值 举例: ~~~ hive> select sin(0.8) from dual; 0.7173560908995228 ~~~ **反正弦函数 : asin** 语法: asin(double a) 返回值: double 说明: 返回a的反正弦值 举例: ~~~ hive> select asin(0.7173560908995228) from dual; 0.8 ~~~ **余弦函数 : cos** 语法: cos(double a) 返回值: double 说明: 返回a的余弦值 举例: ~~~ hive> select cos(0.9) from dual; 0.6216099682706644 ~~~ **反余弦函数 : acos** 语法: acos(double a) 返回值: double 说明: 返回a的反余弦值 举例: ~~~ hive> select acos(0.6216099682706644) from dual; 0.9 ~~~ **positive 函数 : positive** 语法: positive(int a), positive(double a) 返回值: int double 说明: 返回a 举例: ~~~ hive> select positive(-10) from dual; -10 hive> select positive(12) from dual; 12 ~~~ **negative 函数 : negative** 语法: negative(int a), negative(double a) 返回值: int double 说明: 返回-a 举例: ~~~ hive> select negative(-5) from dual; 5 hive> select negative(8) from dual; -8 ~~~