1、使用explode函数将hive表中的Map和Array字段数据进行拆分 lateral view用于和split、explode等UDTF一起使用的,能将一行数据拆分成多行数据,在此基础上可以对拆分的数据进行聚合,lateral view首先为原始表的每行调用UDTF,UDTF会把一行拆分成一 ...
分类:
其他好文 时间:
2020-07-05 21:00:05
阅读次数:
80
hive当中也带有很多的窗口函数以及分析函数,主要用于以下这些场景 (1)用于分区排序 (2)动态Group By (3)Top N (4)累计计算 (5)层次查询 1、创建hive表并加载数据 创建表 hive (hive_explode)> create table order_detail( ...
分类:
其他好文 时间:
2020-07-05 20:55:24
阅读次数:
60
1、If函数: if *** 语法: if(boolean testCondition, T valueTrue, T valueFalseOrNull) 返回值: T 说明: 当条件testCondition为TRUE时,返回valueTrue;否则返回valueFalseOrNull hive> ...
分类:
其他好文 时间:
2020-07-05 19:44:47
阅读次数:
119
1、字符串长度函数:length 语法: length(string A) 返回值: int 说明:返回字符串A的长度 hive> select length('abcedfg') from tableName; 7 2、字符串反转函数:reverse 语法: reverse(string A) 返 ...
分类:
其他好文 时间:
2020-07-05 19:32:00
阅读次数:
71
1、UNIX时间戳转日期函数: from_unixtime *** 语法: from_unixtime(bigint unixtime[, string format]) 返回值: string 说明: 转化UNIX时间戳(从1970-01-01 00:00:00 UTC到指定时间的秒数)到当前时区 ...
分类:
其他好文 时间:
2020-07-05 19:29:26
阅读次数:
65
jieba库的作用就是对中文文章进行分词,提取中文文章中的词语 cut(字符串, cut_all,HMM) 字符串是要进行分词的字符串对象 cut_all参数为真表示采用全模式分词,为假表示采用精确模式分词,默认值为假; HMM为真表示采用HMM模型,为假则不采用,默认值为真。 精确模式jieba. ...
分类:
其他好文 时间:
2020-07-05 19:09:42
阅读次数:
128
1、取整函数: round *** 语法: round(double a) 返回值: BIGINT 说明: 返回double类型的整数值部分 (遵循四舍五入) hive> select round(3.1415926) from tableName; 3 hive> select round(3.5 ...
分类:
其他好文 时间:
2020-07-05 19:08:30
阅读次数:
87
对于测试人员来说使用MySQL中高级部分就是多表的查询,平时日常工作中最多用到的还是单表的查询、修改、删除和添加数据。 接下来介绍下多表查询。 多表查询的分类 1、内链接查询:隐式内连查询、显示内连查询 2、外链接查询:左外连接、右外连接 3、子查询(又叫嵌套查询) 4、union查询(一般SQL注 ...
分类:
数据库 时间:
2020-07-05 17:16:43
阅读次数:
65
手动清除实在是有点烦了,上网搜了一下,发现一个可用的方法 def clear_all(): #Clears all the variables from the workspace of the spyder application. gl = globals().copy() for var in ...
分类:
其他好文 时间:
2020-07-05 17:07:50
阅读次数:
78
1、等值比较: = 语法:A=B 操作类型:所有基本类型 描述: 如果表达式A与表达式B相等,则为TRUE;否则为FALSE hive> select 1 from tableName where 1=1; 2、不等值比较: <> 语法: A <> B 操作类型: 所有基本类型 描述: 如果表达式A ...
分类:
其他好文 时间:
2020-07-05 17:05:09
阅读次数:
66