软件版本如下:
Hostname
IP
Hadoop版本
Hadoop
功能
系统
master
192.168.119.128
1.1.2
namenode
jdk1.6+hadoop+scala2.9.3+spark1.0.0
centos4.9...
分类:
其他好文 时间:
2014-06-25 19:50:09
阅读次数:
227
Apache Hadoop的服务的部署比较繁琐,需要手工处理配置文件、下载依赖包等。Cloudera Manager以GUI的方式的管理CDH集群,提供向导式的安装步骤。由于需要对Hive,HBase,Impala,Spark进行功能测试,就采用了Cloudera Manager方式进行安装。本文讲解的是parcel安装方式。...
分类:
其他好文 时间:
2014-06-24 22:44:17
阅读次数:
501
MapReduce TopK统计加排序中介绍的TopK在mapreduce的实现。
本案例省略的上面案例中的Sort步骤,改用TreeMap来实现获取前K个词
package TopK1;
import java.io.IOException;
import java.util.StringTokenizer;
import org.apache.hadoop.conf.Configurat...
分类:
其他好文 时间:
2014-06-24 22:33:34
阅读次数:
293
难得想写个mapreduce程序,发现已经不记得需要添加那些jar包了,网上找了一会也没发现准确的答案。幸好对hadoop体系结构略知一二,迅速试出了写mapreduce程序需要的三个jar包。
不多不少,3个包足矣……贴出来免得其朋友再走弯路
(请忽视包的版本不一致问题,是我从其他项目中东拼西凑过来的)...
分类:
其他好文 时间:
2014-06-24 21:44:15
阅读次数:
321
接触hadoop第二天,配置hadoop到环境也用了两天,将自己配置到过程写在这里,希望对大家有所帮助!
---------------安装jdk-------------------------------
1.
下载jdk1.6.0_45
2.解压到opt文件夹下,配置/etc/profile,在文件尾部加上
#set java environment
JAVA_H...
分类:
系统相关 时间:
2014-06-24 21:02:22
阅读次数:
285
最近,在研究一些比较成熟的框架,这其中也发现了一些比较不错的文章,现给大家简单翻译其中的一部分(强烈建议大家看一些原版的英文文章,很有帮助)。...
分类:
编程语言 时间:
2014-06-24 19:15:10
阅读次数:
142
org.apache.flume.source.SpoolDirectorySource是flume的一个常用的source,这个源支持从磁盘中某文件夹获取文件数据。不同于其他异步源,这个源能够避免重启或者发送失败后数据丢失。flume可以监控文件夹,当出现新文件时会读取该文件并获取数据。当一个给定的文件被全部读入到通道中时,该文件会被重命名以标志已经完成。同时,该源需要一个清理进程来定期移除完成...
分类:
编程语言 时间:
2014-06-24 15:59:37
阅读次数:
287
Cacti是一套基于PHP,MySQL,SNMP及RRDTool开发的网络流量监测图形分析工具。Cacti是通过 snmpget来获取数据,使用 RRDtool绘画图形,而且你
完全可以不需要了解RRDtool复杂的参数。它提供了非常强大的数据和用户管理功能,可以指定每一个用户能查看树状结构、host以及任何一张图,
还可以与LDAP结合进行用户验证,同时也能自己增加模板,功能非常强大完善。界...
分类:
其他好文 时间:
2014-06-24 15:49:12
阅读次数:
223
因为一台web应用服务器上面安装了多台tomcat,有多个端口,比如默认的8080,还有后续追加的9100,9300,9500等等。一个cacti_host_template_tomcat_server.xml模板只能指定监控一个tomcat服务端口。 因此如果想要监控一台web服务器上的多个tomcat服务器,那么就必须另外想办法,按照一个host上面一个模板监控一个tomcat服务来说的话,要...
分类:
Web程序 时间:
2014-06-24 15:32:33
阅读次数:
214
背景: Hadoop的HDFS文件系统的挂载, 默认指定的文件目录是/mnt/disk{N}. 当运维人员, 不小心把磁盘挂载于其他目录, 比如/mnt/data, /mnt/disk01, /mnt/diska时, HDFS会选择根分区, 当往HDFS里灌数据时, 导致的结果往往是根分区被快速的....
分类:
系统相关 时间:
2014-06-24 15:05:25
阅读次数:
304