搜索关键字：hadoop-mapreduce，搜索到502个结果！码迷,mamicode.com！

Hadoop学习之第四章节：最高温度统计测试程序

1.测试温度数据下载：(稍后补充下载地址)2.将数据上传到hdfs中3.测试代码为：MinTemperatureimportorg.apache.hadoop.fs.Path; importorg.apache.hadoop.io.IntWritable; importorg.apache.hadoop.io.Text; importorg.apache.hadoop.mapreduce.Job; importorg.apache.hadoop.ma..

分类：其他好文时间：2016-04-23 07:42:39 阅读次数：167

云计算（一）——使用 Hadoop Mapreduce 进行数据处理

使用 Hadoop Mapreduce 进行数据处理 1. 综述使用HDP（下载: http://zh.hortonworks.com/products/releases/hdp-2-3/#install）搭建环境，进行分布式数据处理。项目文件下载，解压文件后将看到项目文件夹。该程序将读取 cl ...

分类：其他好文时间：2016-04-14 19:32:24 阅读次数：325

hadoop---wordcount命令

[zznu@master file]$ hadoop jar ~/hadoop-2.5.2/share/hadoop/mapreduce/hadoop-mapreduce-examples-2.5.2.jar wordcount /inputfile output16/04/11 22:31:02 ...

分类：其他好文时间：2016-04-12 14:11:01 阅读次数：182

Hadoop MapReduce InputFormat基础

有时候你可能想要用不同的方法从input data中读取数据。那么你就需要创建一个自己的InputFormat类。 InputFormat是一个只有两个函数的接口。 1 public interface InputFormat<K, V> { 2 InputSplit[] getSplits(Job ...

分类：其他好文时间：2016-04-12 00:27:57 阅读次数：225

在使用windows调用Hadoop 错误 /bin/bash: line 0: fg: no job control一般解决方法

在使用windows调用Hadoop yarn平台的时候，一般都会遇到如下的错误：这个错误在Hadoop mapreduce bug的信息页面（https://issues.apache.org/jira/browse/MAPREDUCE-5655）已经解决了，且影响的版本是Hadoop2.2、H ...

分类：Windows程序时间：2016-04-07 18:31:23 阅读次数：526

大数据 --> spark与hadoop对比

spark与hadoop对比什么是Spark Spark是UC Berkeley AMP lab所开源的类Hadoop MapReduce的通用的并行计算框架，Spark基于map reduce算法实现的分布式计算，拥有Hadoop MapReduce所具有的优点；但不同于MapReduce的是J ...

分类：其他好文时间：2016-04-05 15:32:35 阅读次数：692

Hadoop MapReduce框架详解

Mapreduce初析 Mapreduce是一个计算框架，既然是做计算的框架，那么表现形式就是有个输入（input），mapreduce操作这个输入（input），通过本身定义好的计算模型，得到一个输出（output），这个输出就是我们所需要的结果。重点就是这个计算模型的运行规则。在运行一个mapreduce计算任务时候，任务过程被分为两个阶段：map阶段...

分类：其他好文时间：2016-03-18 14:47:52 阅读次数：298

高效分布式计算系统：Spark

一. 什么是Spark？ Spark是UC Berkeley AMP lab所开源的类Hadoop MapReduce的通用的并行计算框架，Spark基于map reduce算法实现的分布式计算，拥有Hadoop MapReduce所具有的优点；但不同于MapReduce的是Job中间输出和结果可以保存在内存中，从而不再需要读写HDFS，因此Spark能更好地适用于数据挖掘与机器学习等需...

分类：其他好文时间：2016-03-18 14:46:44 阅读次数：318

Hbase快速开始——shell操作

一. 介绍 HBase是一个分布式的、面向列的开源数据库,源于google的一篇论文《bigtable：一个结构化数据的分布式存储系统》。HBase是Google Bigtable的开源实现，它利用Hadoop HDFS作为其文件存储系统，利用Hadoop MapReduce来处理HBa

分类：系统相关时间：2016-03-15 18:42:01 阅读次数：250

不同的瑞士军刀：对比 Spark 和 MapReduce

本文由伯乐在线 - 古月水语翻译，顾星竹校稿。未经许可，禁止转载！来源：http://blog.jobbole.com/97150/ Apache 基金会下的 Spark 再次引爆了大数据的话题。带着比 Hadoop MapReduce 速度要快 100 倍的承诺以及更加灵活方便的 API，

分类：其他好文时间：2016-02-28 12:19:15 阅读次数：172

共502条上一页 1 ... 19 20 21 22 23 ... 51 下一页

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)