码迷,mamicode.com
首页 >  
搜索关键字:hbase hive zookeeper    ( 14462个结果
分布式HBase-0.98.3环境搭建
Hbase是一个分布式,版本化(versioned),构建在 Apache Hadoop和 Apache ZooKeeper上的列数据库.本文使用默认的Zookeeper,构造HDFS基础上的分布式Hbase。1 安装环境操作系统:Ubuntu-12.04 JDK版本:jdk1.7.0_51 计算....
分类:其他好文   时间:2014-06-26 00:31:04    阅读次数:302
shell 脚本实战笔记(3)--集群机器的时间同步设置
背景: 有些分布式服务(比如HBase服务), 依赖于系统时间戳, 如果集群各个节点, 系统时间不一致, 导致服务出现诡异的情况.解决方案: 那如何同步集群各个节点之间的时间? 采用NTP(Network Time Protocol)方式来实现, 选择一台机器, 作为集群的时间同步服务器, 然...
分类:其他好文   时间:2014-06-25 22:59:50    阅读次数:346
java程序员网站
blog or webProject https://github.com/ http://www.open-open.com/2_23.htm http://www.07net01.com/linux/HBase_Hadoopxuexibiji_62422_1359608614.html ...
分类:编程语言   时间:2014-06-25 13:08:07    阅读次数:220
查看hive版本
hive没有提供hive --version这种方式查看版本好,所以要找到hive所在目录,然后查看jar包的版本号,比如:# ls /usr/local/hive/lib/ antlr-2.7.7.jar datanucleus-core-2.0.3.jar hive-jdbc-0.10.0.jar jline-1.0.ja...
分类:其他好文   时间:2014-06-24 23:20:21    阅读次数:377
CDH5上安装Hive,HBase,Impala,Spark等服务
Apache Hadoop的服务的部署比较繁琐,需要手工处理配置文件、下载依赖包等。Cloudera Manager以GUI的方式的管理CDH集群,提供向导式的安装步骤。由于需要对Hive,HBase,Impala,Spark进行功能测试,就采用了Cloudera Manager方式进行安装。本文讲解的是parcel安装方式。...
分类:其他好文   时间:2014-06-24 22:44:17    阅读次数:501
Hadoop Hive sql 语法详解
Hive 是基于Hadoop 构建的一套数据仓库分析系统,它提供了丰富的SQL查询方式来分析存储在Hadoop 分布式文件系统中的数据,可以将结构 化的数据文件映射为一张数据库表,并提供完整的SQL查询功能,可以将SQL语句转换为MapReduce任务进行运行,通过自己的SQL 去查询分析需 要的内容,这套SQL 简称Hive SQL,使不熟悉mapreduce 的用户很方便的利用SQL 语言...
分类:数据库   时间:2014-06-22 22:41:52    阅读次数:342
Hive 进阶
Hive 桶 分区 map array struct...
分类:其他好文   时间:2014-06-22 21:57:10    阅读次数:184
【DB】HBase的基本概念
一 Hbase是个啥东东?  在说Hase是个啥家伙之前,首先我们来看看两个概念,面向行存储和面向列存储。面向行存储,我相信大伙儿应该都清楚,我们熟悉的RDBMS就是此种类型的,面向行存储的数据库主要适合于事务性要求严格场合,或者说面向行存储的存储系统适合OLTP,但是根据CAP理论,传统的RDBMS,为了实现强一致性,通过严格的ACID事务来进行同步,这就造成了系统的可用性和伸缩性方面大大折扣...
分类:数据库   时间:2014-06-22 17:58:25    阅读次数:291
zookeeper入门
1.Zookeeper是什么? ZooKeeper是一个分布式的,开放源码的分布式应用程序协调服务。ZooKeeper的设计非常易于编程,它使用的是类似于文件系统那样的树形数据结构。他的数据都存在内存中,所以速度非常快,当然为了避免内存数据的丢失,所以数据也可以同时保存在硬盘上。 2.Zookeeper能做什么? 场景一:有一组服务器向客户端提供某种服务(例如:我前面做的分布式网...
分类:其他好文   时间:2014-06-22 16:55:46    阅读次数:216
详细图解 快速入门kettle
写在前面一: 数据仓库ETL工具有很多,基于大数据环境下的分析,Hive用的多些。本文介绍国外的 一款开源ETL工具——Kettle。 写在前面二: 所用软件说明: 一、什么是Kettle Kettle是一款国外开源的ETL工具,纯java编写,绿色无需安装,数据抽取高效稳定(数据迁移工具)。Kettle中有两种脚本文件,transformation和job,transf...
分类:其他好文   时间:2014-06-22 12:01:20    阅读次数:619
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!