环境:OS:Centos 6.5 x64 & Soft:Hadoop 
1.2.11、查看当前块大小,默认64M。[huser@master hadoop-1.2.1]$ bin/hadoop fs -stat "%o" 
./in/test1.txt671088642、修改hdfs-site.conf...
                            
                            
                                分类:
其他好文   时间:
2014-05-06 08:59:21   
                                阅读次数:
368
                             
                    
                        
                            
                            
                                namenode 和 secondaryNamenode 
运行在同一机器上,分离配置到新节点上。环境:OS:Centos 6.5 x64 & Soft:Hadoop 
1.2.1master中的配置不是决定谁是namenode,而是决定谁是secondarynamenode。决定谁是namenode的...
                            
                            
                                分类:
其他好文   时间:
2014-05-06 01:08:13   
                                阅读次数:
388
                             
                    
                        
                            
                            
                                Hadoop集群实施成功后,再次格式化名称节点。环境:OS:Centos 6.5 x64 & 
Soft:Hadoop 1.2.11、格式化之前hadoop集群正常。[huser@master hadoop-1.2.1]$ jps7927 
SecondaryNameNode7773 NameNode8...
                            
                            
                                分类:
其他好文   时间:
2014-05-06 00:52:59   
                                阅读次数:
491
                             
                    
                        
                            
                            
                                控制namenode检查点发生的频率。环境:OS:Centos 6.5 x64 & 
Soft:Hadoop 1.2.11、修改core-site.xml,设置参数。 fs.checkpoint.period 
1802、重启集群,查看namenode下文件更新频率,每隔180秒更新一次。[huser@...
                            
                            
                                分类:
其他好文   时间:
2014-05-06 00:26:48   
                                阅读次数:
429
                             
                    
                        
                            
                            
                                在windows下通过安装cygwin模拟linux环境,然后再安装hadoop,是一种简单方便的方式。为hadoop准备的windows下cygwin环境安装过程如下:
- 下载安装文件
最新的cygwin安装文件setup.exe下载地址在这里:http://cygwin.com/install.html。用最新版本的cygwin就可以,我用的是2.774版本的安装程序。
- 安装cyg...
                            
                            
                         
                    
                        
                            
                            
                                能够将热爱的技术应用于实际生活生产中,是做技术人员向往和乐之不疲的事。
           现将前期手里面的一个项目做一个大致的总结,与大家一起分享、交流、进步。项目现在正在线上运行,项目名——基于Hadoop的数据分析综合管理平台。
                         
      项目流程整体比较清晰,爬取数据(txt文本)-->数据清洗-->文本模型训练-->文本分类-...
                            
                            
                                分类:
其他好文   时间:
2014-05-04 00:22:05   
                                阅读次数:
476
                             
                    
                        
                            
                            
                                centos 配置hadoop 2.2. 非常全面...
                            
                            
                                分类:
其他好文   时间:
2014-05-03 16:39:17   
                                阅读次数:
369
                             
                    
                        
                            
                            
                                本文将介绍Hadoop中的重点MapReduce的入门知识。(1)MapReduce概述MapReduce是一种分布式计算模型,由Google提出,主要用于搜索领域,解决海量数据的计算问题。MR由两个阶段组成:Map和Reduce,在Hadoop中用户只需要实现map()和reduce()两个函数,即可实现分布式计算,非常简单..
                            
                            
                                分类:
其他好文   时间:
2014-05-03 01:53:48   
                                阅读次数:
519
                             
                    
                        
                            
                            
                                本文在上一节的基础上通过一个简单的MR示例对MapReduce的运行流程进行分析。假设有两行数据,分别是helloyou,hellome,我们要统计其中出现的单词以及每个单词出现的次数。所得的结果为hello2you1me1(1)大致运行流畅1.解析成2个<k,v>,分别是<0,helloyou><10,hel..
                            
                            
                                分类:
其他好文   时间:
2014-05-03 01:51:40   
                                阅读次数:
382
                             
                    
                        
                            
                            
                                模拟namenode崩溃,将name目录的内容全部删除,然后通过secondary 
namenode恢复namenode。环境:OS:Centos 6.5 x64 & Soft:Hadoop 
1.2.11、进入name目录下,删除name目录内容。[huser@master name]$ pwd/h...
                            
                            
                                分类:
其他好文   时间:
2014-05-02 14:44:28   
                                阅读次数:
517