搜索关键字：分布式 hadoop 集群，搜索到51515个结果！码迷,mamicode.com！

Hadoop之词频统计小实验（基于单节点伪分布）

声明：1）本文由我bitpeach原创撰写，转载时请注明出处，侵权必究。 2）本小实验工作环境为Ubuntu操作系统，hadoop1-2-1，jdk1.8.0。 3）统计词频工作在单节点的伪分布上，至于真正实际集群的配置操作还没有达到，希望能够由本文抛砖引玉。（一）Hadoop的配置修正网上有很多...

分类：其他好文时间：2014-05-05 21:54:47 阅读次数：456

Mahout安装

在Hadoop集群环境下安装Mahout。环境：OS：Centos 6.5 x64 & Soft：Hadoop 1.2.1 & Mahout 0.91、简介mahout项目主页：https://mahout.apache.org/下载二进制包，上传到服务器。2、安装用集群环境用户安装，解压二进制包。...

分类：其他好文时间：2014-05-05 21:35:23 阅读次数：429

ZooKeeper做独立服务器运行(上)

ZooKeeper做独立服务器运行(上)作者：chszs，转载需注明。博客主页：http://blog.csdn.net/chszs一、ZooKeeper安装及配置版本：ZooKeeper v3.4.6稳定版要设置ZooKeeper以单独服务器的模式运行是非常直接的。服务器包含在单个的JAR文件内，因此安装就只需创建一个配置文件。一旦下载了ZooKeeper稳定版，那么解压它，并进入ZooKeep...

分类：其他好文时间：2014-05-05 21:30:05 阅读次数：255

cygwin

在windows下通过安装cygwin模拟linux环境，然后再安装hadoop，是一种简单方便的方式。为hadoop准备的windows下cygwin环境安装过程如下： - 下载安装文件最新的cygwin安装文件setup.exe下载地址在这里：http://cygwin.com/install.html。用最新版本的cygwin就可以，我用的是2.774版本的安装程序。 - 安装cyg...

分类：Windows程序时间：2014-05-05 13:10:02 阅读次数：536

基于Hadoop的数据分析综合管理平台之Hadoop、HBase完全分布式集群搭建

能够将热爱的技术应用于实际生活生产中，是做技术人员向往和乐之不疲的事。现将前期手里面的一个项目做一个大致的总结，与大家一起分享、交流、进步。项目现在正在线上运行，项目名——基于Hadoop的数据分析综合管理平台。项目流程整体比较清晰，爬取数据（txt文本）-->数据清洗-->文本模型训练-->文本分类-...

分类：其他好文时间：2014-05-04 00:22:05 阅读次数：476

Hadoop 2.2 配置安装

centos 配置hadoop 2.2. 非常全面...

分类：其他好文时间：2014-05-03 16:39:17 阅读次数：369

RDD的依赖关系

RDD的依赖关系 Rdd之间的依赖关系通过rdd中的getDependencies来进行表示，在提交job后，会通过在DAGShuduler.submitStage-->getMissingParentStages privatedefgetMissingParentStages(stage: Stage): List[Stage] = { valmissing =newHash...

分类：其他好文时间：2014-05-03 15:56:22 阅读次数：282

memcache

一、memcached简介Memcached是一款开源、高性能、分布式内存对象缓存系统，可应用各种需要缓存的场景，其主要目的是通过降低对Database的访问来加速web应用程序。它是一个基于内存的“键值对”存储，用于存储数据库调用、API调用或页面引用结果的直接数据，如字符串、对象等。m..

分类：其他好文时间：2014-05-03 15:12:31 阅读次数：304

Hadoop初学指南(8)--MapReduce中的Combiner操作

本文主要介绍了MapReduce中的Combiner操作。在MapReduce的执行步骤中，我们一共分了8步，其中Map中的最后一步规约操作就是今天要讲的Combiner。首先看一下前文中的计数器：我们可以发现，其中有两个计数器：Combineoutputrecords和Combineinputrecords，他们的计数都是0，这是..

分类：其他好文时间：2014-05-03 15:00:55 阅读次数：323

Hadoop初学指南(7)--MapReduce自定义计数器

本文主要介绍了MapReduce中的自定义计数器的相关内容。在上次的单词统计例子中，我们可以看到MapReduce在执行过程中会有很多的控制台输出信息，其中有一个很关键的内容：计数器。如下图：可以看到最上方的关键字：Counters，这就表示计数器。在这里，只有一个制表符缩进的表示..

分类：其他好文时间：2014-05-03 14:56:19 阅读次数：336

共51515条上一页 1 ... 5141 5142 5143 5144 5145 ... 5152 下一页

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)