Hadoop学习笔记(4) ——搭建开发环境及编写Hello World 整个Hadoop是基于Java开发的,所以要开发Hadoop相应的程序就得用JAVA。在linux下开发JAVA还数eclipse方便。 下载 进入官网:http://eclipse.org/downloads/。 找到相应....
分类:
其他好文 时间:
2014-07-27 10:35:02
阅读次数:
209
1.前言 学习hadoop的童鞋,倒排索引这个算法还是挺重要的。这是以后展开工作的基础。首先,我们来认识下什么是倒拍索引: 倒排索引简单地就是:根据单词,返回它在哪个文件中出现过,而且频率是多少的结果。这就像百度里的搜索,你输入一个关键字,那么百度引擎就迅速的在它的服务器里找到有该关键字...
分类:
其他好文 时间:
2014-07-27 10:24:42
阅读次数:
266
前言: 作为Hadoop生态系统中重要的一员, HBase作为分布式列式存储, 在线实时处理的特性, 备受瞩目, 将来能在很多应用场景, 取代传统关系型数据库的江湖地位. 本篇主要讲述面向时间序列/面检索的应用场景时, 如何利用HBase的特性去处理和优化. 构造应用场景 某气象局对各个站点...
分类:
其他好文 时间:
2014-07-26 16:49:51
阅读次数:
381
最近研究了下NameNodeHAAutomaticFailover方面的东西,当ActiveNN因为异常或其他原因不能正常提供服务时,处于Standby状态的NN就可以自动切换为Active状态,从而到达真正的高可用NNHAAutomaticFailover架构图为了实现自动切换,需要依赖ZooKeeper和ZKFC组件,ZooKeeper主要用来..
分类:
其他好文 时间:
2014-07-26 03:27:38
阅读次数:
392
Nginx是什么人们在了解新事物时,往往习惯通过类比来帮助自己理解事物的概貌。那么,我们在学习Nginx时也采用同样的方式,先来看看Nginx的竞争对手—Apache、Lighttpd、Tomcat、Jetty、IIS,它们都是Web服务器,或者叫做WWW(WorldWideWeb)服务器,相应地也都具备Web服务器的..
分类:
系统相关 时间:
2014-07-26 03:14:28
阅读次数:
379
突然接到老总需求,需要在现有机房的服务器上边部署KVM,让内网测试机到达外网去测试。说实话有些头疼,因为我们的硬件资源实在是太缺了(小公司...),只有100G的剩余空间,让我在上边跑俩台虚拟机,还得应付时刻增涨的数据,这无疑让我很无语...hadoop可是在这台服务器的.....
分类:
其他好文 时间:
2014-07-26 03:13:27
阅读次数:
188
Spring设置
你能嵌入Jetty到你的项目中,也可以使用几乎所有的IoC类型框架,包括Spring。如果所有你想做的是在你的Spring中设置Jetty Server,那么下面的xml片段可以作为一个例子。如果你想使用spring取代jetty-xml也是可以的,但这样将不能利用模块系统的其余部分。
Jetty-Spring模块
一个Jetty Spring模块的框架能通过模块机制激活。...
分类:
其他好文 时间:
2014-07-26 02:46:56
阅读次数:
177
Ganglia监控软件主要是用来监控系统性能的软件,如:cpu 、mem、硬盘利用率, I/O负载、网络流量情况等,通过曲线很容易见到每个节点的工作状态,对合理调整、分配系统资源,提高系统整体性能起到重要作用。
本言讲解如何利用ganglia监控hbase指标,过滤无用的指标,并实现单独管理 hadoop metrics system 的功能,修改指标配置不用重启hbase。...
分类:
其他好文 时间:
2014-07-26 02:41:16
阅读次数:
385
把程序打成jar包放到Linux上
转到目录下执行命令 hadoop jar mapreducer.jar /home/clq/export/java/count.jar hdfs://ubuntu:9000/out06/count/
上面一个是本地文件,一个是上传hdfs位置
成功后出现:打印出来,你所要打印的字符。
package com.clq.hdfs;
import java...
分类:
编程语言 时间:
2014-07-26 02:27:17
阅读次数:
270