Hive数据类型
基本数据类型
tinyint,smallint,int,biging,float,double,decimal,char,varchar,string,binary,boolean,timestamp,date,
引用数据类型
Array:相同数据类型组合的数组,使用array[1]访问
MAP:Key-value键值对,通过键进行访问,使用map['key']访问
...
分类:
其他好文 时间:
2015-08-17 19:30:51
阅读次数:
125
1.Hive概述1.1在hadoop生态圈中属于数据仓库的角色。它能够管理hadoop中的数据,同时可以查询hadoop中的数据。 本质上讲,hive是一个SQL解析引擎。Hive可以把SQL查询转换为MapReduce中的job来运行。 hive有一套映射工具,可以把SQL转换为Map...
分类:
其他好文 时间:
2015-08-17 19:28:48
阅读次数:
197
现有两张表:sales列出了人名及其所购商品的ID;things列出商品的ID和名称:hive> select * from sales;OKJoe 2Hank 4Ali 0Eve 3Hank 2Time taken: 0.085 seconds, Fetched...
分类:
其他好文 时间:
2015-08-17 19:23:04
阅读次数:
107
1.导入数据除了前面使用的LOADDATA方式把文件复制或移动到表的目录外,还有以下几种方式:1).Insert Overwrite Tablehive> insert overwrite table school > select age,name from student;2)....
分类:
其他好文 时间:
2015-08-17 16:57:46
阅读次数:
161
列出 hive的 所有库
sqoop list-databases --connect jdbc:mysql://localhost --username hive --password hive
列出所有的表
sqoop list-tables --connect jdbc:mysql://localhost/hive_metadata --username hive --passwo...
分类:
其他好文 时间:
2015-08-17 15:33:44
阅读次数:
130
1.内部表内部表在LOAD数据时,如果使用LOCAL关键字,Hive会把本地文件系统中的数据文件复制到Hive的/warehouse目录。反之,则是将HDFS上的数据文件剪切到/warehouse目录。Hive在LOAD数据时,并不检查目录中的文件是否符合为表所声明的模式。只有通过SELECT查询返...
分类:
其他好文 时间:
2015-08-17 13:59:25
阅读次数:
149
1.分区表 假如有一日志文件,其中每条记录都包含一个时间戳。我们根据日期来对他进行分区,那么同一天的记录就会被存放在同一个分区中。为避免产生过多小文件,建议只对离散字段分区。使用分区并不会影响大范围查询的执行,仍然可以跨分区查询。分区实质:在数据表文件夹下再次创建分区文件夹2.子分区 在日期分区.....
分类:
其他好文 时间:
2015-08-17 13:44:52
阅读次数:
805
1.hive常用的数据类型包括: tinyInt(byte),smallint(short),int,bigint(long),float,double,boolean,string类型。【括号中对应java类型】补充:对于mysql中的varchar和char类型:若字符串长度小于10建议用ch....
分类:
其他好文 时间:
2015-08-17 13:36:40
阅读次数:
5062
1.本文命令的两种模式: 交互模式,即hive的shell环境:hive>…. 非交互模式:普通的Linux命令模式:%.....2.HiveShell常用操作 1)hive-e:从命令行执行指定的HQL,不需要分号: %hive-e'select*fromdummy'>a.txt 2...
分类:
系统相关 时间:
2015-08-17 13:33:38
阅读次数:
254
数据库和数据仓库的区别:1)数据库内数据是动态变化的; 而数据仓库是用来存储数据的(一次写入,多次读取),数据是静态的,只能通过修改数据文件来修改数据仓库中的数据;2)数据库中的数据结构比较复杂,而数据仓库中的数据结构则相对简单;3)数据库在操作数据时要求响应速度快,即实时的进行增删改查;而数据仓....
分类:
其他好文 时间:
2015-08-17 11:41:15
阅读次数:
321