Hive的介绍和安装Hive是什么Hive是一个数据仓库,使用sql脚本就可以了
Hive包含几个引擎
解释器,编译器,优化器等接触hive首先我们进入到相应的官方文档中,接触hive的命令使用https://cwiki.apache.org/confluence/display/Hive/LanguageManual然后我们打开命令行的模式usage: hive -d,--define <ke...
分类:
其他好文 时间:
2015-06-30 18:17:49
阅读次数:
132
配置mapreduce
<!--
Licensed under the Apache License, Version 2.0 (the "License");
you may not use this file except in...
分类:
其他好文 时间:
2015-06-30 18:17:42
阅读次数:
125
Hadoop2.4.x 实例测试 WordCount程序
分类:
其他好文 时间:
2015-06-30 12:46:46
阅读次数:
202
伪分布式hadoop的三种安装方式:Local (Standalone) ModePseudo-Distributed ModeFully-Distributed Mode安装之前需要$ sudo apt-get install ssh $ sudo apt-get install rsync详见....
分类:
其他好文 时间:
2015-06-28 22:54:22
阅读次数:
335
Hadoop的两大功能:海量数据存储和海量数据分析
Hadoop2的三大核心组件是:HDFS、MapperReducer和yarn
1、HDFS:分布式文件系统海量数据存储
2、MapperReducer:运算框架,海量数据分析
3、yarn:资源调度管理集群
HDFS工作机制:基于namenode和datanode
1、namenode:响应客户端的请求;负责维护整个...
分类:
其他好文 时间:
2015-06-27 16:40:29
阅读次数:
203
以下基于上篇Hadoop2.6集群部署:http://lizhenliang.blog.51cto.com/7876557/1661354接下来安装Hadoop数据仓库Hive,上节了解HBase简单使用,听起来HBase与Hive有些类似,概念也有点模糊,那我们先了解下他们之间有什么区别:HBase是一种分布式、面向列的NoSQL数据库,基于HDF..
分类:
其他好文 时间:
2015-06-26 15:08:58
阅读次数:
142
因为使用需要,在自己小本上建了四个虚拟机,打算搭建一个1+3的hadoop分布式系统。环境:hadoop2.7.0+ubuntu14.04 (64位)首先分别为搭建好的虚拟机的各主机重命名方法:vi /etc/hostname例如:ubuntu0 ubuntu1 ubuntu2 ubuntu3一. ...
分类:
系统相关 时间:
2015-06-26 12:18:13
阅读次数:
160
版本:虚拟机下安装的ubuntu14.04(x64),hadoop-2.6.0下面是hadoop2.6.0的官方教程(英文):http://hadoop.apache.org/docs/r2.6.0/hadoop-project-dist/hadoop-common/SingleCluster.ht...
分类:
系统相关 时间:
2015-06-26 01:43:56
阅读次数:
498
基于上篇Hadoop2.6集群部署博文:http://lizhenliang.blog.51cto.com/7876557/1661354接下来部署HBase1.0分布式NoSQL数据库,HBase中涉及到HMaster和HRegionServer两个概念。(注:以下概念来着百度百科)HMaster主要负责Table和Region管理工作:1.管理用户对Table的增、删、改..
分类:
数据库 时间:
2015-06-24 19:20:33
阅读次数:
296
IT-培训基于Greenplum Hadoop分布式平台的大数据解决方案及商业应用案例剖析Hadoop2.0_YARN_Spark_Storm_Tez技术培训视频教程基于IBM Cognos Report studio技术的商业智能解决方案(广播分发报表、EVENT STUDIO)基于IBM Cog...
分类:
其他好文 时间:
2015-06-24 08:10:41
阅读次数:
172