码迷,mamicode.com
首页 >  
搜索关键字:hadoop-mapreduce    ( 502个结果
Hadoop学习之第四章节:最高温度统计测试程序
1.测试温度数据下载:(稍后补充下载地址)2.将数据上传到hdfs中3.测试代码为:MinTemperatureimportorg.apache.hadoop.fs.Path; importorg.apache.hadoop.io.IntWritable; importorg.apache.hadoop.io.Text; importorg.apache.hadoop.mapreduce.Job; importorg.apache.hadoop.ma..
分类:其他好文   时间:2016-04-23 07:42:39    阅读次数:167
云计算(一)——使用 Hadoop Mapreduce 进行数据处理
使用 Hadoop Mapreduce 进行数据处理 1. 综述 使用HDP(下载: http://zh.hortonworks.com/products/releases/hdp-2-3/#install)搭建环境,进行分布式数据处理。 项目文件下载,解压文件后将看到项目文件夹。该程序将读取 cl ...
分类:其他好文   时间:2016-04-14 19:32:24    阅读次数:325
hadoop---wordcount命令
[zznu@master file]$ hadoop jar ~/hadoop-2.5.2/share/hadoop/mapreduce/hadoop-mapreduce-examples-2.5.2.jar wordcount /inputfile output16/04/11 22:31:02 ...
分类:其他好文   时间:2016-04-12 14:11:01    阅读次数:182
Hadoop MapReduce InputFormat基础
有时候你可能想要用不同的方法从input data中读取数据。那么你就需要创建一个自己的InputFormat类。 InputFormat是一个只有两个函数的接口。 1 public interface InputFormat<K, V> { 2 InputSplit[] getSplits(Job ...
分类:其他好文   时间:2016-04-12 00:27:57    阅读次数:225
在使用windows调用Hadoop 错误 /bin/bash: line 0: fg: no job control一般解决方法
在使用windows调用Hadoop yarn平台的时候,一般都会遇到如下的错误: 这个错误在Hadoop mapreduce bug的信息页面(https://issues.apache.org/jira/browse/MAPREDUCE-5655)已经解决了,且影响的版本是Hadoop2.2、H ...
分类:Windows程序   时间:2016-04-07 18:31:23    阅读次数:526
大数据 --> spark与hadoop对比
spark与hadoop对比 什么是Spark Spark是UC Berkeley AMP lab所开源的类Hadoop MapReduce的通用的并行计算框架,Spark基于map reduce算法实现的分布式计算,拥有Hadoop MapReduce所具有的优点;但不同于MapReduce的是J ...
分类:其他好文   时间:2016-04-05 15:32:35    阅读次数:692
Hadoop MapReduce框架详解
Mapreduce初析        Mapreduce是一个计算框架,既然是做计算的框架,那么表现形式就是有个输入(input),mapreduce操作这个输入(input),通过本身定义好的计算模型,得到一个输出(output),这个输出就是我们所需要的结果。        重点就是这个计算模型的运行规则。在运行一个mapreduce计算任务时候,任务过程被分为两个阶段:map阶段...
分类:其他好文   时间:2016-03-18 14:47:52    阅读次数:298
高效分布式计算系统:Spark
一. 什么是Spark? Spark是UC Berkeley AMP lab所开源的类Hadoop MapReduce的通用的并行计算框架,Spark基于map reduce算法实现的分布式计算,拥有Hadoop MapReduce所具有的优点;但不同于MapReduce的是Job中间输出和结果可以保存在内存中,从而不再需要读写HDFS,因此Spark能更好地适用于数据挖掘与机器学习等需...
分类:其他好文   时间:2016-03-18 14:46:44    阅读次数:318
Hbase快速开始——shell操作
一. 介绍       HBase是一个分布式的、面向列的开源数据库,源于google的一篇论文《bigtable:一个结构化数据的分布式存储系统》。HBase是Google Bigtable的开源实现,它利用Hadoop HDFS作为其文件存储系统,利用Hadoop MapReduce来处理HBa
分类:系统相关   时间:2016-03-15 18:42:01    阅读次数:250
不同的瑞士军刀:对比 Spark 和 MapReduce
本文由 伯乐在线 - 古月水语 翻译,顾星竹 校稿。未经许可,禁止转载! 来源:http://blog.jobbole.com/97150/ Apache 基金会下的 Spark 再次引爆了大数据的话题。带着比 Hadoop MapReduce 速度要快 100 倍的承诺以及更加灵活方便的 API,
分类:其他好文   时间:2016-02-28 12:19:15    阅读次数:172
502条   上一页 1 ... 19 20 21 22 23 ... 51 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!