码迷,mamicode.com
首页 >  
搜索关键字:hadoop 2.7.2 大数据 hdfs ha    ( 28781个结果
Hadoop之词频统计小实验(基于单节点伪分布)
声明:1)本文由我bitpeach原创撰写,转载时请注明出处,侵权必究。 2)本小实验工作环境为Ubuntu操作系统,hadoop1-2-1,jdk1.8.0。 3)统计词频工作在单节点的伪分布上,至于真正实际集群的配置操作还没有达到,希望能够由本文抛砖引玉。(一)Hadoop的配置修正 网上有很多...
分类:其他好文   时间:2014-05-05 21:54:47    阅读次数:456
Mahout安装
在Hadoop集群环境下安装Mahout。环境:OS:Centos 6.5 x64 & Soft:Hadoop 1.2.1 & Mahout 0.91、简介mahout项目主页:https://mahout.apache.org/下载二进制包,上传到服务器。2、安装用集群环境用户安装,解压二进制包。...
分类:其他好文   时间:2014-05-05 21:35:23    阅读次数:429
利用JavaAPI访问HDFS的文件
利用JavaAPI访问HDFS的文件 1、重读配置文件core-site.xml要利用Java客户端来存取HDFS上的文件,不得不说的是配置文件hadoop-0.20.2/conf/core-site.xml了,最初我就是在这里吃了大亏,所以我死活连不上HDFS,文件无法创建、读取。hadoop.t...
分类:编程语言   时间:2014-05-03 22:10:40    阅读次数:300
高效5步走,快速搭建Hadoop2伪分布环境
前两天将Hadoop2的完全分布式搭建文档整理发布于网上(http://blog.csdn.net/aaronhadoop/article/details/24859369),朋友相邀,就再将Hadoop2的伪分布式文档整理一下,搭建过Hadoop2完全分布式后,就笑对“伪分布式”说声 呵呵吧。        前期的jdk环境、SSH免密钥登录配置在此就不再赘述了,直接进入hadoop2的配...
分类:其他好文   时间:2014-05-03 21:51:45    阅读次数:344
百度技术沙龙 - 大数据场景下主题检索应用
第48期百度技术沙龙上的《大数据场景下主题检索应用》讲座介绍了很多训练大规模主题模型的技术细节。讲座回来后,我粗略整理了下讲座上涉及的主题模型和训练大规模模型相关的资料和文献。 1. 主题模型的发展历史     a. 布尔模型 Boolean model     b. 向量空间模型 VSM (Vector space model)     c. 潜在语义索引 LSI (Latent...
分类:其他好文   时间:2014-05-03 21:40:07    阅读次数:371
hadoop无法启动
dataNode 无法启动是配置过程中最常见的问题,主要原因是多次format namenode 造成namenode 和datanode的clusterID不一致。建议查看datanode上面的log信息。解决办法:修改每一个datanode上面的CID(位于dfs/data/current/VERSION文件夹中)使两者一致。...
分类:其他好文   时间:2014-05-03 21:37:44    阅读次数:308
Keepalived基础知识
大纲:一、什么是Keepalived?二、VRRP协议简介.三、Keepalived原理.四、Keepalived配置文件详解.五、Keepalived配置示例.一、什么是Keepalived?什么是Keepalived呢,keepalived观其名可知,保持存活,在网络里面就是保持在线了,也就是所谓的高可用或热备,用来防止单点故障(..
分类:其他好文   时间:2014-05-03 20:48:19    阅读次数:528
Hadoop初学指南(8)--MapReduce中的Combiner操作
本文主要介绍了MapReduce中的Combiner操作。在MapReduce的执行步骤中,我们一共分了8步,其中Map中的最后一步规约操作就是今天要讲的Combiner。首先看一下前文中的计数器:我们可以发现,其中有两个计数器:Combineoutputrecords和Combineinputrecords,他们的计数都是0,这是..
分类:其他好文   时间:2014-05-03 15:00:55    阅读次数:323
Hadoop初学指南(7)--MapReduce自定义计数器
本文主要介绍了MapReduce中的自定义计数器的相关内容。在上次的单词统计例子中,我们可以看到MapReduce在执行过程中会有很多的控制台输出信息,其中有一个很关键的内容:计数器。如下图:可以看到最上方的关键字:Counters,这就表示计数器。在这里,只有一个制表符缩进的表示..
分类:其他好文   时间:2014-05-03 14:56:19    阅读次数:336
HAproxy配置文件详解
一、简介HAProxy提供高可用性、负载均衡以及基于TCP和HTTP应用的代理,支持虚拟主机,它是免费、快速并且可靠的一种解决方案。HAProxy特别适用于那些负载特大的web站点,这些站点通常又需要会话保持或七层处理。HAProxy运行在当前的硬件上,完全可以支持数以万计的并发连接。并..
分类:其他好文   时间:2014-05-03 14:50:13    阅读次数:836
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!