码迷,mamicode.com
首页 >  
搜索关键字:hadoop2    ( 1326个结果
hadoop2.2.0安装笔记
NameNode 192.168.1.122 ?hadoop/hadoop VM ?192.168.1.123? DataNode1 192.168.1.124 datanode1/datanode1 hadoop/hadoop DataNode2 192.168.1.125 datanode2/datanode2 hadoop/hadoop 一、在所有机器上安装o...
分类:其他好文   时间:2014-07-22 09:10:37    阅读次数:199
win7下安装hadoop2.2.0.涵盖64位
想了解hadoop,所以就下了最新的文件,搭建相关的环境,以下为自己在win7上搭建hadoop的相关步骤。 ? ? ? ? 1、下载hadoop,用winRAR解压。(路径不能有空格) ? ? ? ? 2、安装java,此处就不做讲解了。...
分类:Windows程序   时间:2014-07-22 08:16:35    阅读次数:450
打造基于hadoop的网站日志分析系统(5)之spark在日志分析系统里的简单应用
1.下载spark和运行 wget?http://apache.fayea.com/apache-mirror/spark/spark-1.0.0/spark-1.0.0-bin-hadoop2.tgz 我这里下载的是1.0.0版,由于我们只是测试spark的用法所以不需要配置spark集群,只需把下好的文件...
分类:Web程序   时间:2014-07-21 10:21:45    阅读次数:206
mahout贝叶斯算法拓展篇3---分类无标签数据
代码测试环境:Hadoop2.4+Mahout1.0前面博客:mahout贝叶斯算法开发思路(拓展篇)1和mahout贝叶斯算法开发思路(拓展篇)2 分析了Mahout中贝叶斯算法针对数值型数据的处理。在前面这两篇博客中并没有关于如何分类不带标签的原始数据的处理。下面这篇博客就针对这样的数据进行处理。最新版(适合Hadoop2.4+mahout1.0环境)源码以及jar包可以在这里下载:下载后参考...
分类:其他好文   时间:2014-07-20 23:19:06    阅读次数:463
Why Hadoop2
Why Hadoop2? 自从Hadoop2出现之后,其迅速取代了Hadoop1的地位,并丰富了Hadoop的应用场景。如果现在有公司使用Hadoop的话,往往直接采用Hadoop2了。 Hadoop2能被如此广泛的使用,肯定有其自身的优势,本文将对其进行梳理...
分类:其他好文   时间:2014-07-19 12:01:58    阅读次数:179
windows下eclipse+hadoop2
windows下eclipse+hadoop2.4开发手册1.解压下载的hadoop2.4,到任意盘符,例如D:\hadoop-2.4.0。2.设置环境变量①新建系统变量,如下所示。②将新建的HADOOP_HOME变量“%HADOOP_HOME%\bin;”加入到PATH变量里,如下图。3.将had...
分类:Windows程序   时间:2014-07-18 22:14:51    阅读次数:525
hadoop编程小技巧(4)---全局key排序类TotalOrderPartitioner
Hadoop代码测试版本:Hadoop2.4原理:在进行MR程序之前对输入数据进行随机提取样本,把样本排序,然后在MR的中间过程Partition的时候使用这个样本排序的值进行分组数据,这样就可以达到全局排序的目的了。难点:如果使用Hadoop提供的方法来实现全局排序,那么要求Mapper的输入、输出的key不变才可以,因为在源码InputSampler中提供的随机抽取的数据是输入数据最原始的ke...
分类:其他好文   时间:2014-07-18 18:04:00    阅读次数:314
hadoop编程小技巧(3)---自定义分区类Partitioner
Hadoop代码测试环境:Hadoop2.4原理:在Hadoop的MapReduce过程中,Mapper读取处理完成数据后,会把数据发送到Partitioner,由Partitioner来决定每条记录应该送往哪个reducer节点,默认使用的是HashPartitioner,其核心代码如下:/** Use {@link Object#hashCode()} to partition. */ p...
分类:其他好文   时间:2014-07-17 15:06:56    阅读次数:315
Java学习网站大全
0.  java学习必看,你的大方向http://java.itcast.cn/subject/hadoop2/index.shtml?140701lcqqq1 1、JDK6中文API:http://tool.oschina.net/apidocs/apidoc?api=jdk-zh 2、Netty4.x用户向导:http://netty.io/wiki/user-guide-for-4.x....
分类:编程语言   时间:2014-07-15 22:37:33    阅读次数:312
Mapreduce执行过程分析(基于Hadoop2.4)——(三)
4.4 Reduce类4.4.1 Reduce介绍整完了Map,接下来就是Reduce了。YarnChild.main()—>ReduceTask.run()。ReduceTask.run方法开始和MapTask类似,包括initialize()初始化,根据情况看是否调用runJobCleanupT...
分类:其他好文   时间:2014-07-13 19:36:42    阅读次数:227
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!