1. Hive的分区表 1.1 hive的分区表的概念 1.2 hive分区表的构建 创建一个分区字段的分区表 创建一个分区字段的分区表 创建二级分区表 创建二级分区表 2、Hive修改表结构 2.1 修改表的名称 2.2 表的结构信息 2.3 增加/修改/替换列信息 增加列 增加列 修改列 修改列 ...
分类:
其他好文 时间:
2019-10-03 10:18:38
阅读次数:
113
一、常用数据结构: 1. list http://www.cplusplus.com/reference/list/list/ https://www.geeksforgeeks.org/list-cpp-stl/ 表示双向链表;单向链表用forward_list; 可以在常数时间复杂度内进行插入和 ...
分类:
编程语言 时间:
2019-10-02 16:34:46
阅读次数:
76
设计模式的目的是为了提高代码的整洁性、降低代码的资源占用量。可分为以下三种:创建型设计模式、结构性设计模式、行为设计模式。 ...
分类:
编程语言 时间:
2019-10-02 01:02:38
阅读次数:
116
HDP(Hortonworks Data Platform)是hortworks推出的100%开源的hadoop发行版本,以YARN 作为其架构中心,包含pig、hive、phoniex、hbase、storm、spark等大量组件,在最新的2.4版本,监控UI实现与grafana集成,包含组件版本 ...
分类:
其他好文 时间:
2019-10-02 00:52:57
阅读次数:
138
学号 20182325 《数据结构与面向对象程序设计》第4周学习总结 教材学习内容总结 类是对象的蓝图,对象是类的实例化。 方法是类的具体体现。 类的数据和方法都称为类的成员。 在具体编写类的时候,先是数据声明再是方法声明。 toString方法用println或print或字符串连接会自动调用。 ...
分类:
其他好文 时间:
2019-09-30 16:22:19
阅读次数:
79
一、全表查询和特定列查询 1、全表查询: hive (db_test)> select * from dept;OKdept.deptno dept.dname dept.loc10 ACCOUNTING 170020 RESEARCH 180030 SALES 190040 OPERATIONS ...
分类:
其他好文 时间:
2019-09-30 14:32:57
阅读次数:
107
schematool的作用为:升级元数据,换句话来说"最新的元数据重新写入mysql中". 如果在hive命令行中,删除某库,报错:hive.啥 不存在. 此时就要升级元数据. 升级元数据前提: 在hive的lib目录下,要有mysql的驱动jar包. hive的配置文件hive/conf/hive ...
分类:
其他好文 时间:
2019-09-30 12:59:15
阅读次数:
113
2019 2020 1 20175212童皓桢 《信息安全系统设计基础》第4周学习总结 教材学习内容总结 1.进制转换 人工运算时,可用二进制为媒介 2.三种运算 位级运算 & | ~ ^(异或) 逐位进行运算 逻辑运算 && || ! 只有1和0 移位运算 逻辑右移:左端补k个0 算数右移:左端补 ...
分类:
其他好文 时间:
2019-09-29 21:38:38
阅读次数:
86
sql优化: 数据倾斜的处理方式: -- Q: 活动数据 和 对应的维表进行关联,其中某个活动特别的大。 A: 1) 给关联健加入一个随机的 1-10的值 2)将维度表 的关联健, 每个加上 1-10的值,将维度表扩充十倍。 3)然后将2个表进行join,从而来消除数据倾斜。 -- 尽量不使用cou ...
分类:
数据库 时间:
2019-09-29 18:15:32
阅读次数:
107
语法: 分析函数 over(partition by 列名 order by 列名 rows between 开始位置 and 结束位置) 常用分析函数: 聚合类 avg()、sum()、max()、min() 排名类 row_number() 按照值排序时产生一个自增编号,不会重复 rank() ...
分类:
其他好文 时间:
2019-09-29 16:52:50
阅读次数:
236