码迷,mamicode.com
首页 >  
搜索关键字:hbase hive zookeeper    ( 14462个结果
转:openTSDB 2.0 安装
OpenTSDB-2.0.0安装布署2014-02-27 11:07:49|分类:大数据|标签:hadoop|举报|字号订阅1、介绍OpenTSDB是一个架构在Hbase系统之上的实时监控信息收集和展示平台。它支持秒级数据采集所有metrics,支持永久存储,可以做容量规划,并很容易的接入到现有的报...
分类:数据库   时间:2014-07-07 08:00:49    阅读次数:780
HBase client
通过HBase client访问HBase时,配置如下:Configuration conf = HBaseConfiguration.create();// Zookeeper地址 conf.set(HConstants.ZOOKEEPER_QUORUM, "master.hadoop");//....
分类:其他好文   时间:2014-07-07 00:38:13    阅读次数:250
Flume 实战(1) -- 初体验
前言: Flume-ng是数据收集/聚合/传输的组件, Flume-ng抛弃了Flume OG原本繁重的zookeeper和Master, Collector, 其整体的架构更加的简洁和明了. 其基础组件就Agent进程, 内部又可以细分为Source, Channel, Sink三个组件, S.....
分类:其他好文   时间:2014-07-07 00:26:46    阅读次数:355
HBase存储时间相关多列数据的两种方案
所谓“时间相关多列数据”指的是同一个Key下具有多个属性数据,并且这些数据与时间具有相关性,多数场景是该Key对应在不同时间时刻的行为数据。在实际应用中,这类数据很多,例如电子商务网站上用户最近一段时间浏览的宝贝集合、访问的URL列表等。使用HBase存储此类数据时,有以下两种常用的方案:多行单列表...
分类:其他好文   时间:2014-07-06 21:25:23    阅读次数:175
一个轻客户端,多语言支持,去中心化,自动负载,可扩展的实时数据写服务的实现方案讨论
背景是设计一个实时数据接入的模块,负责接收客户端的实时数据写入(如日志流,点击流),数据支持直接下沉到HBase上(后续提供HBase上的查询),或先持久化到Kafka里,方便后续进行一些计算和处理,再下沉到文件系统或做别的输出。 在设计中,对于客户端和服务端有这么些目标。 客户端需要支持多语言(Java,C++),做得尽量轻量级,只要连上服务端的ip:port,以RPC的形式调用简单的write就可以把数据写出去。客户端不承担任何逻辑的处理,服务端的负载均衡对客户端是透明的。 服务端想要做的是一个去中心...
分类:其他好文   时间:2014-07-04 08:59:19    阅读次数:552
读书笔记-HBase in Action-第二部分Advanced concepts-(3)非Java客户端
HBase Shell HBase shell使用起来最方便,进入HBase shell控制台即可使用。 $ $HBASE_HOME/bin/hbase shell 常见操作有create(创建表)/put(插入或更新数据)/get(根据rowkey查询)/scan(范围查询)/delete(删除列)/deleteAll(根据rowkey删除整行数据)/disable&drop(禁用表之后再...
分类:编程语言   时间:2014-07-04 08:12:54    阅读次数:383
hue3.5.0使用初探(cdh版本)
之前一直用phpHiveAdmin,也一直在关注hue,最近打算调研一下hue,hue在最近两年发展很快,页面效果和功能上都有很大程度的提升,所支持的服务也越来越多,除了hive,hbase,目前还支持sqoop,impala,pig等。hue的一个大致架构如下图所示核心服务是HueServer,在本地使用SQLLite作..
分类:其他好文   时间:2014-07-04 06:16:59    阅读次数:469
读书笔记-HBase in Action-第二部分Advanced concepts-(2)Coprocessor
Coprocessor是HBase 0.92.0引入的特性。使用Coprocessor,可以将一些计算逻辑下推到HBase节点,HBase由一个单纯的存储系统升级为分布式数据处理平台。 Coprocessor分为两种:Observer和Endpoint。Observer能修改扩展已有的客户端操作功能,而Endpoint能引入新的客户端操作。 Observer Observer的作用类似于数据...
分类:其他好文   时间:2014-07-03 15:35:50    阅读次数:247
hive2solr multivalue功能实现
之前介绍了github上的hive2solr项目和solr的multivalue功能。线上我们是采用hive计算完数据后推送到solr的方法,如果需要实现multivalue的话,默认的hive2solr是有些问题的。即使在hive中对于的field是多个字,导入solr之后也只是一个整体的字符串,比如下面表的数据如下:idte..
分类:其他好文   时间:2014-07-03 14:10:57    阅读次数:199
Hadoop初学指南(10)--ZooKeeper的集群安装和操作
本文简单介绍了ZooKeeper的基本知识。(1)概述①什么是ZooKeeper?Zookeeper是Google的Chubby一个开源的实现,是Hadoop的分布式协调服务它包含一个简单的原语集,分布式应用程序可以基于它实现同步服务,配置维护和命名服务等②Zookeeper的角色③为什么使用Zookeeper?大部分分..
分类:其他好文   时间:2014-07-03 14:02:30    阅读次数:269
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!