码迷,mamicode.com
首页 >  
搜索关键字:kettle hbase    ( 4514个结果
Hadoop实战安装
环境:centos6.4X64192.168.2.20Master192.168.2.21Hadoop1192.168.2.22Hadoop2准备工作:1、安装基本开发工具:(所有服务器)yumgroupinstall"DevelopmentTools"-y2、设置IP和hostname映射关系(所有服务器)vi/etc/hosts修改内容如下192.168.2.20Master192.168.2.21Hadoop11..
分类:其他好文   时间:2015-01-09 01:48:11    阅读次数:275
详解kettle插件开发之一
最近因为项目需要接触了kettle,需要为用户定制一些特定的转换。 下面记录一下自己的学习经历。 下载的kettle版本文件稳定版,从github上面下载  github不熟的朋友可以参考文章  如何更好的理解和使用Github fork一个版本  然后clone in  desktop           地址为        https://github.com/bigfishman/...
分类:其他好文   时间:2015-01-08 20:12:02    阅读次数:322
Nutch 快速入门(Nutch 2.2.1+Hbase+Solr)
http://www.tuicool.com/articles/VfEFjmNutch 2.x 与 Nutch 1.x 相比,剥离出了存储层,放到了gora中,可以使用多种数据库,例如HBase, Cassandra, MySql来存储数据了。Nutch 1.7 则是把数据直接存储在HDFS上。1....
分类:其他好文   时间:2015-01-08 11:16:36    阅读次数:4606
zookeeper系列之一—zookeeper入门
Zookeeper是什么? Zookeeper故名思议动物管理员,它是拿来管大象(Hadoop)、蜜蜂(Hive)、小猪(Pig)的管理员,Apache Hbase和Apache Solr以及LinkedIn sensei等项目都采用到了Zookeeper。Zookeeper是一个分布式的,开放源....
分类:其他好文   时间:2015-01-07 18:16:30    阅读次数:131
HBase内存结构之跳表数据结构浅析
最近学习HBase源码时发现HRegion在sotre管理上用到了跳表数据结构ConcurrentSkipListMap: ConcurrentSkipListMap有几个ConcurrentHashMap 不能比拟优点: 1、ConcurrentSkipListMap 的key是有序的。 2、ConcurrentSkipListMap 支持更高的并发。...
分类:其他好文   时间:2015-01-07 13:08:24    阅读次数:191
HBase入门篇
目录:1-HBase的安装2-Java操作HBase例子3-HBase简单的优化技巧4–存储5(集群) -压力分载与失效转发6 -白话MySQL(RDBMS)与HBase之间7 -安全&权限1-HBase的安装HBase是什么?HBase是Apache Hadoop中的一个子项目,Hbase依托于H...
分类:其他好文   时间:2015-01-07 00:35:53    阅读次数:268
[hadoop]hadoop学习路线
1、主要学习hadoop中的四大框架:hdfs、mapreduce、hive、hbase。这四大框架是hadoop最最核心的,学习难度最大的,也是应用最广泛的。2、熟悉了解hadoop基本知识及其所需要的知识例如java基础、linux环境、linux常用命令3、hadoop一些基本知识:hadoo...
分类:其他好文   时间:2015-01-06 15:21:31    阅读次数:187
基于外部ZooKeeper的GlusterFS作为分布式文件系统的完全分布式HBase集群安装指南
# (WJW)基于外部ZooKeeper的GlusterFS作为分布式文件系统的完全分布式HBase集群安装指南 --- ## [X] 前提条件 + 服务器列表: > `192.168.1.84 hbase84` #**hbase-master** > `192.168.1.85 hbase85` #**hbase-re...
分类:其他好文   时间:2015-01-06 13:56:18    阅读次数:273
KETTLE_内存溢出错误
原创作品,出自 “深蓝的blog” 博客,欢迎转载,转载时请务必注明以下出处,否则追究版权法律责任。 深蓝的blog:   kettle内存溢出错误解决 环境: 源端数据库:oracle 10G R2 目标端数据库:oracle 11G R2 kettle版本:5.0.1-stable 报错: 抽取大数据量表时,报错,日志信息如下: 2015/01/05 11:27:42 -...
分类:其他好文   时间:2015-01-06 09:59:13    阅读次数:252
Hadoop/Yarn/MapReduce内存分配(配置)方案
以horntonworks给出推荐配置为蓝本,给出一种常见的Hadoop集群上各组件的内存分配方案。方案最右侧一栏是一个8G VM的分配方案,方案预留1-2G的内存给操作系统,分配4G给Yarn/MapReduce,当然也包括了HIVE,剩余的2-3G是在需要使用HBase时预留给HBase的。Configuration FileConfiguration SettingValue Calcula...
分类:其他好文   时间:2015-01-06 08:38:43    阅读次数:160
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!