搜索关键字：ambari hadoop hbase hive spark，搜索到26003个结果！码迷,mamicode.com！

hbase memstorelab

关于MemStore的补充在通过HStore.add向store中添加一个kv时，首先把数据写入到memstore中。这一点没有什么说明； publiclongadd(finalKeyValue kv) { lock.readLock().lock(); try{ returnthis.memstore.add(kv); }finally{ lock.readLock().un...

分类：其他好文时间：2014-05-12 14:14:38 阅读次数：340

MongoDB简单操作

Hadoop核心技术厂商Cloudera将在2014/06推出hadoop Ecosystem与MongoDB的整合产品,用MongoDB与ipmala及hbase,hive一起用;开源linux领军企业RHEL也宣布RHEL将整合MongoDB用于简化用户账号管理与LDAP一起用;1,基于命令行的...

分类：数据库时间：2014-05-12 11:45:03 阅读次数：457

python 实现Hadoop的partitioner和二次排序

Hadoop Streaming 是一个工具，代替编写Java的实现类，而利用可执行程序来完成map-reduce过程工作流程　：　 InputFile --> mappers --> [Partitioner] --> reducers --> outputFiles 理解 :　 1 输入文件，可以是指定远程文件系统内的文件夹下的 * 2 通过集群自己分解到各个PC...

分类：编程语言时间：2014-05-11 14:46:35 阅读次数：519

Hadoop-2.2.0中文文档—— MapReduce 下一代 -- 公平调度器

目的此文档描述了 FairScheduler, Hadoop 的一个可插入式的调度器，允许 YARN 应用在一个大集群中公平地共享资源。简介公平调度是一种分配资源给应用的方法，以致到最后，平均上所有应用获得相等的资源。 Hadoop NextGen 能够调度多种类型的资源。默认的， Fair Scheduler 仅以内存为基础作公平调度决策。可以用Ghodsi 等开发的 ...

分类：其他好文时间：2014-05-11 13:05:57 阅读次数：393

大数据Lambda架构

1 Lambda架构介绍 Lambda架构划分为三层，分别是批处理层，服务层，和加速层。最终实现的效果，可以使用下面的表达式来说明。 query = function(alldata) 1.1 批处理层批处理层主用由Hadoop来实现，负责数据的存储和产生任意的视图数据。计算视图数据是一个联系操作，因此，当新数据到达时，使用MapReduce迭代地将数据聚集到视图中。从整个数据集中计算...

分类：其他好文时间：2014-05-11 07:29:44 阅读次数：419

hbase hfilev2

HFileV2文件 HFileV2文件写入通过StoreFile.Writer-->HFileWriterV2进行写入。文件格式通过hfile.format.version配置。默认为2，也只有2这个值在0.96可用。可通过cf中配置DATA_BLOCK_ENCODING配置dataBlock的encoding, 可配置值：NONE,PREFIX,DIFF,FAST_DIFF,PREF...

分类：其他好文时间：2014-05-11 02:57:42 阅读次数：589

Spark0.9 安装

1、下载Scala wget http://www.scala-lang.org/files/archive/scala-2.10.3.tgz tar xvzf scala-2.10.3.tgz -C /usr/local 2、下载Spark wget http://www.apache.org/dist/incubator/spark/spark-0.9.0-inc...

分类：其他好文时间：2014-05-11 02:06:21 阅读次数：368

Hadoop 学习资料集锦

Hadoop 资料虾皮系列教程。Sqoop 资料官方安装文档。浪迹天涯博客。……

分类：其他好文时间：2014-05-11 01:07:23 阅读次数：298

hbase源码系列（七）Snapshot的过程

在看这一章之前，建议大家先去看一下snapshot的使用。可能有人会有疑问为什么要做Snapshot，hdfs不是自带了3个备份吗，这是个很大的误区，要知道hdfs的3个备份是用于防止网络传输中的失败或者别的异常情况导致数据块丢失或者不正确，它不能避免人为的删除数据导致的后果。它就想是给数据库做.....

分类：其他好文时间：2014-05-10 23:14:45 阅读次数：519

Samza在YARN上的启动过程 =》之二 submitApplication

首先，来看怎么构造一个org.apache.hadoop.yarn.client.api.YarnClientclass ClientHelper(conf: Configuration) extends Logging { val yarnClient = YarnClient.createYa....

分类：移动开发时间：2014-05-10 22:39:32 阅读次数：656

共26003条上一页 1 ... 2583 2584 2585 2586 2587 ... 2601 下一页

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)