声明:1)本文由我bitpeach原创撰写,转载时请注明出处,侵权必究。
2)本小实验工作环境为Ubuntu操作系统,hadoop1-2-1,jdk1.8.0。
3)统计词频工作在单节点的伪分布上,至于真正实际集群的配置操作还没有达到,希望能够由本文抛砖引玉。(一)Hadoop的配置修正 网上有很多...
分类:
其他好文 时间:
2014-05-05 21:54:47
阅读次数:
456
在Hadoop集群环境下安装Mahout。环境:OS:Centos 6.5 x64 &
Soft:Hadoop 1.2.1 & Mahout
0.91、简介mahout项目主页:https://mahout.apache.org/下载二进制包,上传到服务器。2、安装用集群环境用户安装,解压二进制包。...
分类:
其他好文 时间:
2014-05-05 21:35:23
阅读次数:
429
所用环境:Windows Server 2008 + ghc 7.6.3(Haskell
Platform 2013.2.0.0自带的) + pandoc 1.12.4。操作步骤:1. 安装Haskell Platform。2.
安装pandoc,安装命令:cabal install pandoc。...
简介LNMMP=Linux+Nginx+MySQL+Memcache+PHP;利用Nginx的高性能特点做前端反向代理服务器,分发用户请求,并在能够利用缓存的地方使用Memcache缓存服务,以加速缓存效率,具体架构图如下;具体部署代理层:Nginx编译安装Nginxyum
install gcc ...
分类:
其他好文 时间:
2014-05-03 22:48:02
阅读次数:
688
由于ubuntu中可能会有默认的jdk,如openjdk,所以,为了使默认使用的是我们安装的jdk,还要进行如下工作。执行代码:update-alternatives
--install /usr/bin/java java /usr/lib/jvm/java/jdk1.6.0_12/bin/jav...
分类:
其他好文 时间:
2014-05-03 22:39:52
阅读次数:
436
利用JavaAPI访问HDFS的文件
1、重读配置文件core-site.xml要利用Java客户端来存取HDFS上的文件,不得不说的是配置文件hadoop-0.20.2/conf/core-site.xml了,最初我就是在这里吃了大亏,所以我死活连不上HDFS,文件无法创建、读取。hadoop.t...
分类:
编程语言 时间:
2014-05-03 22:10:40
阅读次数:
300
前两天将Hadoop2的完全分布式搭建文档整理发布于网上(http://blog.csdn.net/aaronhadoop/article/details/24859369),朋友相邀,就再将Hadoop2的伪分布式文档整理一下,搭建过Hadoop2完全分布式后,就笑对“伪分布式”说声
呵呵吧。
前期的jdk环境、SSH免密钥登录配置在此就不再赘述了,直接进入hadoop2的配...
分类:
其他好文 时间:
2014-05-03 21:51:45
阅读次数:
344
CentOS6和RHEL6系统的YUM中包含了MySQL安装包,版本是MySQL5。rpm软件包的名称是mysql-server。
使用以下命令可以安装MySQL数据库:
yum install -y mysql-server
安装完成后我们可以通过以下命令启动MySQL服务:
service mysqld start
第一次启动MySQL服务后,...
分类:
数据库 时间:
2014-05-03 21:14:54
阅读次数:
462
ExchangeServer2013部署(二)先决条件及必备组件安装上文我们已经介绍了部署环境和AD架构的准备,本文进行安装邮箱服务器前的组件安装一、安装远程工具管理包;打开Powershell输入Install-WindowsFeatureRSAT-ADDS二、在Server2012安装Exchange2013所需的必备项取决于您想要安..
分类:
其他好文 时间:
2014-05-03 15:16:16
阅读次数:
526
本文主要介绍了MapReduce中的自定义计数器的相关内容。在上次的单词统计例子中,我们可以看到MapReduce在执行过程中会有很多的控制台输出信息,其中有一个很关键的内容:计数器。如下图:可以看到最上方的关键字:Counters,这就表示计数器。在这里,只有一个制表符缩进的表示..
分类:
其他好文 时间:
2014-05-03 14:56:19
阅读次数:
336