前一篇的问题解决了,是 hbase 下面lib 包的jar问题,之前写MR的时候加错了包,替换掉了原来的包后出现另一问题:@ubuntu:/home/hadoop/hbase-0.94.6-cdh4.5.0/bin$ ./start-hbase.sh starting master, logging...
                            
                            
                                分类:
编程语言   时间:
2014-06-26 21:41:53   
                                阅读次数:
829
                             
                    
                        
                            
                            
                                http://www.zlovezl.cn/articles/40/简介: Zookeeper 分布式服务框架是 Apache Hadoop 的一个子项目,它主要是用来解决分布式应用中经常遇到的一些数据管理问题,如:统一命名服务、状态同步服务、集群管理、分布式应用配置项的管理等。具体简介可以参照这....
                            
                            
                                分类:
编程语言   时间:
2014-06-26 18:43:35   
                                阅读次数:
281
                             
                    
                        
                            
                            
                                Sqoop官网:http://sqoop.apache.org/*) Sqoop介绍Sqoop用来在Hadoop和关系数据库中传递数据。通过sqoop,我们可以方便的将数据从关系数据库导入到HDFS,或者将数据从HDFS导出到关系数据库。参考链接:http://blog.csdn.net/yfkis...
                            
                            
                                分类:
其他好文   时间:
2014-06-26 17:49:46   
                                阅读次数:
212
                             
                    
                        
                            
                            
                                摘要:Hadoop已经成为大数据的代名词。短短几年间,Hadoop从一种边缘技术成为事实上的标准。而另一方面,MapReduce在谷歌已不再显赫。当企业瞩目MapReduce的时候,谷歌好像早已进入到了下一个时代。 Hadoop技术已经无处不在。不管是好是坏,Hadoop已经成为大数据的代名词。短短...
                            
                            
                                分类:
其他好文   时间:
2014-06-26 17:02:48   
                                阅读次数:
191
                             
                    
                        
                            
                            
                                Apache Storm是一个免费、开源、分布式的实时计算系统。相对于Hadoop适用于批处理而言,利用Storm可以非常容易地对流式数据进行实时可靠处理。Storm使用简单,支持多种编程语言且非常有趣!...
                            
                            
                                分类:
其他好文   时间:
2014-06-26 14:20:52   
                                阅读次数:
294
                             
                    
                        
                            
                            
                                # 学习前言
想学习一下Flume,网上找了好多文章基本上都说的很简单,只有一半什么的,简直就是坑爹,饿顿时怒火就上来了,学个东西真不容易,然后自己耐心的把这些零零碎碎的东西整理整理,各种搭环境实验之后才弄好的,也不容易啊,希望可以帮到想学Flume的你 、、、
# Flume介绍
Flume是Cloudera提供的一个高可用的,高可靠的,分布式的海量日志采集、聚合和传输的系统,Flume支持在日志系统中定制各类数据发送方,用于收集数据;同时,Flume提供对数据进行简单处理,并写到各种数据接受方(可定制...
                            
                            
                                分类:
其他好文   时间:
2014-06-26 08:01:52   
                                阅读次数:
449
                             
                    
                        
                            
                            
                                使用MultipleInputs.addInputPath 对多个路径输入
现在假设有三个目录,并使用了三个mapper去处理,
经过map处理后,输出的结果会根据key 进行join,
如果使用TextPair,会根据第一个字段jion,第二个字段排序
然后在作为reduce的输入,进行计算...
                            
                            
                                分类:
其他好文   时间:
2014-06-26 07:49:51   
                                阅读次数:
250
                             
                    
                        
                            
                            
                                Impala是Cloudera公司主导开发的新型查询系统,它提供SQL语义,能查询存储在Hadoop的HDFS和HBase中的PB级大数据。已有的Hive系统虽然也提供了SQL语义,但由于Hive底层执行使用的是MapReduce引擎,仍然是一个批处理过程,难以满足查询的交互性。相比之下,Impala的最大特点也是最大卖点就是它的快速。Impala 为存储在 HDFS 和 HBase 中的数据提供了一个实时 SQL 查询接口。...
                            
                            
                                分类:
其他好文   时间:
2014-06-25 10:56:38   
                                阅读次数:
355
                             
                    
                        
                            
                            
                                问题导读:1. 推荐系统概述;2. 推荐系统指标设计;3. Hadoop并行算法;4. 推荐系统架构;5. MapReduce程序实现。前言Netflix电影推荐的百万美金比赛,把“推荐”变成了时下最热门的数据挖掘算法之一。也正是由于Netflix的比赛,让企业界和学科界有了更深层次的技术碰撞。引发...
                            
                            
                                分类:
其他好文   时间:
2014-06-25 09:46:57   
                                阅读次数:
329