码迷,mamicode.com
首页 >  
搜索关键字:mapreduce topk算法    ( 4057个结果
MapReduce 2.x 编程 系列二 Map阶段实现
现在想从日志中提取数据,日志文件如下:2014-05-10 13:36:40,140307000287,536dbacc4700aab274729cca,login 2014-05-10 13:37:46,140310000378,536dbae74700aab274729ccb,login 2014-05-10 13:39:20,140310000382,536dbb284700aab27472...
分类:其他好文   时间:2014-09-26 02:38:28    阅读次数:340
MapReduce 1.x 编程 系列三 Reduce阶段实现
Reduce代码就是做加和统计,package org.freebird.reducer; import java.io.IOException; import org.apache.hadoop.io.IntWritable; import org.apache.hadoop.mapreduce.Reducer.Context; import org.apache.hadoop.mapredu...
分类:其他好文   时间:2014-09-26 02:02:58    阅读次数:146
hadoop出现Cannot initialize Cluster. Please check your configuration for mapreduce.framework.name
PriviledgedActionException as:crabman (auth:SIMPLE) cause:java.io.IOException: Cannot initialize Cluster. Please check your configuration for mapreduce.framework.name and the correspond server address...
分类:其他好文   时间:2014-09-24 22:24:48    阅读次数:471
MapReduce 1.x 编程 系列一 搭建基本的Maven工程
这是一个maven 工程,安装完mvn 3.2.2后, mvn --version Apache Maven 3.2.3 (33f8c3e1027c3ddde99d3cdebad2656a31e8fdf4; 2014-08-12T04:58:10+08:00) Maven home: /opt/apache-maven-3.2.3 Java version: 1.7.0_09, vendor: O...
分类:其他好文   时间:2014-09-24 14:58:57    阅读次数:182
大数据图数据库之MapReduce用于图计算
/* 版权声明:可以任意转载,转载时请务必标明文章原始出处和作者信息 .*/                 CopyMiddle: 张俊林                                     节选自《大数据日知录:架构与算法》十四章,书籍目录在此1.使用Mapreduce进行图计算          使用MapReduce框架来针对大规模图数据进行计算的研究工作相对较少,这主...
分类:数据库   时间:2014-09-23 23:06:45    阅读次数:281
Hadoop日记Day12---MapReduce学习
一、MapReduce简介1.1 MapReduce概述 MapReduce是一种分布式计算模型,由Google提出,主要用于搜索领域,解决海量数据的计算问题。MR由两个阶段组成:Map和Reduce,用户只需要实现map()和reduce()两个函数,即可实现分布式计算,其执行流程如图1。这两个....
分类:其他好文   时间:2014-09-23 22:14:05    阅读次数:368
Hadoop中shuffle阶段流程分析
Hadoop中shuffle阶段流程分析MapReduce longteng9个月前 (12-23)399浏览0评论宏观上,Hadoop每个作业要经历两个阶段:Map phase和reduce phase。对于Map phase,又主要包含四个子阶段:从磁盘上读数据-》执行map函数-》combin...
分类:其他好文   时间:2014-09-23 20:42:45    阅读次数:252
mongoDB的map reduce
mongoDB的map reduce使用 示例: res = db.runCommand({     mapreduce:'liveEpgUserVisits',     map:function() {         emit({provice:this.provice}, {"data":[{"mac":this.mac}],visit:this.visitNum, use...
分类:数据库   时间:2014-09-23 19:55:17    阅读次数:268
Hadoop实战之四~hadoop作业调度详解(2)
这篇文章将接着上一篇wordcount的例子,抽象出最简单的过程,一探MapReduce的运算过程中,其系统调度到底是如何运作的。情况一:数据和运算分开的情况 wordcount这个例子的是hadoop的helloworld程序,作用就是统计每个单词出现的次数而已。其过程是:现在我用文字再来描述下....
分类:其他好文   时间:2014-09-23 14:36:44    阅读次数:227
Storm介绍
Storm是一个分布式的、可靠的、容错的数据流处理系统(流式计算框架,可以和mapreduce的离线计算框架对比理解)。 整个任务被委派给不同的组件,每个组件负责一个简单的特定的处理任务。Storm集群的输入流是一个叫...
分类:其他好文   时间:2014-09-23 13:10:17    阅读次数:348
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!