搜索关键字：hadoop-mapreduce，搜索到502个结果！码迷,mamicode.com！

『转载』hadoop 1.X到2.X的变化

表1新旧hadoop脚本/变量/位置变化表由于新的 Yarn 框架与原 Hadoop MapReduce 框架相比变化较大，核心的配置文件中很多项在新框架中已经废弃，而新框架中新增了很多其他配置项，看下表所示会更加清晰：表2 新旧hadoop框架配置项变化表 ...

分类：其他好文时间：2017-06-07 14:22:57 阅读次数：162

Hadoop MapReduce编程 API入门系列之mr编程快捷键活用技巧详解（四）

1、Shift + Alt + S Hadoop没有使用jdk自带的默认序列化机制。现在呢，hadoop-2.*里有两套序列化机制。一个是自己hadoop的序列化机制，一个是谷歌的。所以，要改为。。 ********* >　reduce 把前面一大串，去掉，就不出错了。因为接口里没这样写全。为 ...

分类：Windows程序时间：2017-05-24 12:36:02 阅读次数：230

Spark和Hadoop MapReduce之间的比较

关于两者的讨论文章： https://www.zhihu.com/question/26568496 http://blog.jobbole.com/97150/ 文章通过多个角度对两者进行对比，根据目前的使用情况，Spark更适用于我们的大数据平台进行大数据运算。公司的Spark集群资源正在搭建 ...

分类：其他好文时间：2017-05-04 21:53:27 阅读次数：145

hadoop-mapreduce中reducetask执行分析

ReduceTask的执行 Reduce处理程序中须要运行三个类型的处理， 1.copy,从各map中copy数据过来 2.sort,对数据进行排序操作。 3.reduce,运行业务逻辑的处理。 ReduceTask的执行也是通过run方法開始，通过mapreduce.job.reduce.shu ...

分类：其他好文时间：2017-05-04 14:48:27 阅读次数：250

Hadoop(4)-MapReduce

在之前建立的HDFS基础上，自己编写MapReduce程序，打包，并运行。重新打包WordCount并执行新建一个Maven项目，将示例程序中WordCount.java的复制到新项目中，使用mvn clean package打包为jar文件并复制到服务器。 WordCount.java内容如下 ...

分类：其他好文时间：2017-04-28 22:08:13 阅读次数：145

Hadoop_MapReduce流程

Hadoop学习笔记总结 01. MapReduce 1. Combiner（规约） Combiner号称本地的Reduce。问：为什么使用Combiner？答：Combiner发生在Map端，对数据进行规约处理，数据量变小了，传送到reduce端的数据量变小了，传输时间变短，作业的整体时间变短。 ...

分类：其他好文时间：2017-04-27 23:10:37 阅读次数：360

Spark集群模式&Spark程序提交

Spark集群模式&Spark程序提交 1. 集群管理器 Spark当前支持三种集群管理方式 Standalone—Spark自带的一种集群管理方式，易于构建集群。 Apache Mesos—通用的集群管理，可以在其上运行Hadoop MapReduce和一些服务应用。 Hadoop YARN—Ha ...

分类：其他好文时间：2017-04-25 00:37:59 阅读次数：227

Hadoop-2.2.0中文文档—— 从Hadoop 1.x 迁移至 Hadoop 2.x

简单介绍本文档对从 Apache Hadoop 1.x 迁移他们的Apache Hadoop MapReduce 应用到 Apache Hadoop 2.x 的用户提供了一些信息。在 Apache Hadoop 2.x 中，我们已经把资源管理功能放入分布式应用管理框架的Apache Hado ...

分类：其他好文时间：2017-04-16 18:55:48 阅读次数：282

MapReduce计数器

MapReduce计数器计数器输出运行完毕作业之后的计数器输出内置计数器 Hadoop为每个作业提供了若干内置计数器，用以描述各项指标。文件系统计数器所属类：org.apache.hadoop.mapreduce.FileSystemCounter BYTES_READ：文件系统读取的字节 ...

分类：其他好文时间：2017-04-15 19:08:04 阅读次数：263

Spark：超越Hadoop MapReduce

引言：和Hadoop一样，Spark提供了一个Map/ReduceAPI（分布式计算）和分布式存储。二者主要的不同点是，Spark在集群的内存中保存数据，而Hadoop在集群的磁盘中存储数据。本文选自《SparkGraphX实战》。大数据对一些数据科学团队来说是主要的挑战，因为在要求的可扩展性方面单机..

分类：其他好文时间：2017-04-12 22:16:52 阅读次数：171

共502条上一页 1 ... 12 13 14 15 16 ... 51 下一页

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)