在安装Hive时,一定要在该机器上添加了hadoop服务。 1. 下载并解压文件 2. 修改环境变量 编辑/etc/profile文件在其末尾添加如下内容: 3. 检测Hive是否安装成功,显示版本则表示安装成功 4. 修改配置文件,复制hive env.sh.template,为hive env. ...
分类:
其他好文 时间:
2019-02-28 00:59:03
阅读次数:
133
"一、Hive概念" "二、为什么要是用Hive" "三、Hive优缺点" "四、hive架构" 一、Hive概念 Hive最初是应Facebook每天产生的海量新兴社会网络数据进行管理和机器学习的需求而产生和发展的,是建立在Hadoop上的数据仓库基础架构。作为Hadoopd的一个数据仓库的工具, ...
分类:
其他好文 时间:
2019-02-28 00:58:01
阅读次数:
134
建表语句 CREATE EXTERNAL TABLE `my_lzo_table`(`something` string)ROW FORMAT DELIMITED FIELDS TERMINATED BY '\t' STORED AS INPUTFORMAT 'com.hadoop.mapred.D ...
分类:
其他好文 时间:
2019-02-26 18:58:57
阅读次数:
391
select a.* from ( select a.*,rand(12345) as random from tripdata a ) a where random between 0 and 0.2; a.country a.city a.visitors a.random 阿联酋 迪拜 268 ...
分类:
其他好文 时间:
2019-02-25 20:23:33
阅读次数:
275
1. 使用 Tez 2. 使用 ORCFILE。当有多个表 join 时,使用 ORCFile 进行存储,会显著地提高速度。 3. 使用 VECTORIZATION。会提高 scans, aggregations, filters and joins 等操作的性能。它会把 1024条记录做为一批进行 ...
分类:
其他好文 时间:
2019-02-25 13:34:08
阅读次数:
632
第1章 Hive入门1.1 什么是Hive1.2 Hive的优缺点1.2.1 优点1.2.2 缺点1.3 Hive架构原理1.4 Hive和数据库比较1.4.1 查询语言1.4.2 数据存储位置1.4.3 数据更新1.4.4 索引1.4.5 执行1.4.6 执行延迟1.4.7 可扩展性1.4.8 数 ...
分类:
其他好文 时间:
2019-02-25 09:20:30
阅读次数:
199
1.查看是否已经安装了git: git --version2.如果安装的版本不对,就卸载了: yum remote git 3.查看yum中git的版本信息: yum info git4.如果是自己想要的版本,则可以直接通过yum进行安装: yum install git。 5.下载正确版本的git ...
分类:
系统相关 时间:
2019-02-25 00:39:47
阅读次数:
168
一 URL配置 Django 1.11版本 URLConf官方文档 URL配置(URLconf)就像Django 所支撑网站的目录。它的本质是URL与要为该URL调用的视图函数之间的映射表。你就是以这种方式告诉Django,对于这个URL调用这段代码,对于那个URL调用那段代码。 基本格式 注意: ...
分类:
Web程序 时间:
2019-02-23 01:36:09
阅读次数:
267
问题 在Ubuntu中,有时候运用sudo apt-get install 安装软件时,会出现如下的情况: 三种解决方案 这是由于apt因某种原因还在后台运行 1、找到并且杀掉所有的apt-get 和apt进程 运行下面的命令来生成所有含有 apt 的进程列表,你可以使用ps和grep命令并用管道组 ...
分类:
系统相关 时间:
2019-02-23 01:33:20
阅读次数:
308
接触flink已经有3个月了,第一次接触flink是从极客时间上的大沙的演讲中了解的。 最近半年对大数据已经有了一定的入门,一方面因为工作中会用到hive,另外工作已经快5年了,一直从事java后台开发,但是一直没有搞明白最终要做什么。 虽然接触大数据比较晚,但是还好接触了。感觉现在进入到了一个新领 ...
分类:
其他好文 时间:
2019-02-23 01:09:26
阅读次数:
206