搜索关键字：hbase hive zookeeper，搜索到14462个结果！码迷,mamicode.com！

转：openTSDB 2.0 安装

OpenTSDB-2.0.0安装布署2014-02-27 11:07:49|分类：大数据|标签：hadoop|举报|字号订阅1、介绍OpenTSDB是一个架构在Hbase系统之上的实时监控信息收集和展示平台。它支持秒级数据采集所有metrics，支持永久存储，可以做容量规划，并很容易的接入到现有的报...

分类：数据库时间：2014-07-07 08:00:49 阅读次数：780

HBase client

通过HBase client访问HBase时，配置如下：Configuration conf = HBaseConfiguration.create();// Zookeeper地址 conf.set(HConstants.ZOOKEEPER_QUORUM, "master.hadoop");//....

分类：其他好文时间：2014-07-07 00:38:13 阅读次数：250

Flume 实战(1) -- 初体验

前言: Flume-ng是数据收集/聚合/传输的组件, Flume-ng抛弃了Flume OG原本繁重的zookeeper和Master, Collector, 其整体的架构更加的简洁和明了. 其基础组件就Agent进程, 内部又可以细分为Source, Channel, Sink三个组件, S.....

分类：其他好文时间：2014-07-07 00:26:46 阅读次数：355

HBase存储时间相关多列数据的两种方案

所谓“时间相关多列数据”指的是同一个Key下具有多个属性数据，并且这些数据与时间具有相关性，多数场景是该Key对应在不同时间时刻的行为数据。在实际应用中，这类数据很多，例如电子商务网站上用户最近一段时间浏览的宝贝集合、访问的URL列表等。使用HBase存储此类数据时，有以下两种常用的方案：多行单列表...

分类：其他好文时间：2014-07-06 21:25:23 阅读次数：175

一个轻客户端，多语言支持，去中心化，自动负载，可扩展的实时数据写服务的实现方案讨论

背景是设计一个实时数据接入的模块，负责接收客户端的实时数据写入（如日志流，点击流），数据支持直接下沉到HBase上（后续提供HBase上的查询），或先持久化到Kafka里，方便后续进行一些计算和处理，再下沉到文件系统或做别的输出。在设计中，对于客户端和服务端有这么些目标。客户端需要支持多语言（Java，C++），做得尽量轻量级，只要连上服务端的ip:port，以RPC的形式调用简单的write就可以把数据写出去。客户端不承担任何逻辑的处理，服务端的负载均衡对客户端是透明的。服务端想要做的是一个去中心...

分类：其他好文时间：2014-07-04 08:59:19 阅读次数：552

读书笔记-HBase in Action-第二部分Advanced concepts-(3)非Java客户端

HBase Shell HBase shell使用起来最方便，进入HBase shell控制台即可使用。 $ $HBASE_HOME/bin/hbase shell 常见操作有create(创建表)/put(插入或更新数据)/get(根据rowkey查询)/scan(范围查询)/delete(删除列)/deleteAll(根据rowkey删除整行数据)/disable&drop(禁用表之后再...

分类：编程语言时间：2014-07-04 08:12:54 阅读次数：383

hue3.5.0使用初探(cdh版本)

之前一直用phpHiveAdmin，也一直在关注hue，最近打算调研一下hue，hue在最近两年发展很快,页面效果和功能上都有很大程度的提升，所支持的服务也越来越多，除了hive,hbase,目前还支持sqoop,impala,pig等。hue的一个大致架构如下图所示核心服务是HueServer，在本地使用SQLLite作..

分类：其他好文时间：2014-07-04 06:16:59 阅读次数：469

读书笔记-HBase in Action-第二部分Advanced concepts-(2)Coprocessor

Coprocessor是HBase 0.92.0引入的特性。使用Coprocessor，可以将一些计算逻辑下推到HBase节点，HBase由一个单纯的存储系统升级为分布式数据处理平台。 Coprocessor分为两种：Observer和Endpoint。Observer能修改扩展已有的客户端操作功能，而Endpoint能引入新的客户端操作。 Observer Observer的作用类似于数据...

分类：其他好文时间：2014-07-03 15:35:50 阅读次数：247

hive2solr multivalue功能实现

之前介绍了github上的hive2solr项目和solr的multivalue功能。线上我们是采用hive计算完数据后推送到solr的方法，如果需要实现multivalue的话，默认的hive2solr是有些问题的。即使在hive中对于的field是多个字，导入solr之后也只是一个整体的字符串，比如下面表的数据如下：idte..

分类：其他好文时间：2014-07-03 14:10:57 阅读次数：199

Hadoop初学指南(10)--ZooKeeper的集群安装和操作

本文简单介绍了ZooKeeper的基本知识。(1)概述①什么是ZooKeeper？Zookeeper是Google的Chubby一个开源的实现，是Hadoop的分布式协调服务它包含一个简单的原语集，分布式应用程序可以基于它实现同步服务，配置维护和命名服务等②Zookeeper的角色③为什么使用Zookeeper？大部分分..

分类：其他好文时间：2014-07-03 14:02:30 阅读次数：269

共14462条上一页 1 ... 1419 1420 1421 1422 1423 ... 1447 下一页

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)