码迷,mamicode.com
首页 >  
搜索关键字:hadoop-mapreduce    ( 502个结果
一文读懂MapReduce 附流量解析实例
1.MapReduce是什么 Hadoop MapReduce是一个软件框架,基于该框架能够容易地编写应用程序,这些应用程序能够运行在由上千个商用机器组成的大集群上,并以一种可靠的,具有容错能力的方式并行地处理上TB级别的海量数据集。这个定义里面有着这些关键词, 一是软件框架,二是并行处理,三是可靠 ...
分类:其他好文   时间:2020-01-17 13:43:04    阅读次数:78
spark初识
一.简介 1.什么是spark Apache Spark 是专为大规模数据处理而设计的快速通用的计算引擎。Spark是UC Berkeley AMP lab (加州大学伯克利分校的AMP实验室)所开源的类Hadoop MapReduce的通用并行计算框架,Spark拥有Hadoop MapReduc ...
分类:其他好文   时间:2019-12-30 14:10:45    阅读次数:100
hadoop自带性能测试
一、TestDFSIO 读写性能测试切换到目录: /opt/hadoop/share/hadoop/mapreduce/ 清空数据hadoop jar hadoop-mapreduce-client-jobclient-2.6.4.jar -cleanhadoop fs -ls /benchmark ...
分类:其他好文   时间:2019-12-29 23:30:19    阅读次数:113
Spark原理及关键技术点
Spark Apache Spark 是专为大规模数据处理而设计的快速通用的计算引擎。Spark是UC Berkeley AMP lab (加州大学伯克利分校的AMP实验室)所开源的类Hadoop MapReduce的通用并行框架,Spark,拥有Hadoop MapReduce所具有的优点;但不同 ...
分类:其他好文   时间:2019-12-27 00:11:15    阅读次数:106
云计算与大数据实验:Hbase shell操作成绩表
【实验目的】 1)了解hbase服务 2)学会hbase shell命令操作成绩表 【实验原理】 HBase是一个分布式的、面向列的开源数据库,它利用Hadoop HDFS作为其文件存储系统,利用Hadoop MapReduce来处理HBase中的海量数据。本试验中hbase提供了一个shell的终 ...
分类:系统相关   时间:2019-11-23 15:54:07    阅读次数:276
关于MapReduce默认分区策略
MapReduce默认分区策略 mapreduce 默认的分区方式是hashPartition,在这种分区方式下,KV对根据key的hashcode值与reduceTask个数进行取模,决定该键值对该要访问哪个ReduceTask。 以下就是Hadoop MapReduce中对于默认分区的源码 1. ...
分类:其他好文   时间:2019-11-11 21:34:13    阅读次数:113
【hadoop】MapReduce分布式计算框架原理
PS:实操部分就省略了哈,准备最近好好看下理论这块,其实我是比较懒得哈!!! <?>MapReduce的概述 MapReduce是一种计算模型,进行大数据量的离线计算。MapReduce实现了Map和Reduce两个功能:其中Map是滴数据集上的独立元素进行指定的操作,生成键——值对形式中间结果。其 ...
分类:其他好文   时间:2019-10-07 00:50:10    阅读次数:157
大数据-hadoop-MapReduce计算流程
MapReduce计算流程 MapReduce计算流程 1 首先是通过程序员所编写的MR程序通过命令行本地提交或者IDE远程提交 2 一个MR程序就是一个Job,Job信息会给Resourcemanger,向Resourcemanger注册信息 3 在注册通过后,Job会拷贝相关的资源信息(从HDF ...
分类:其他好文   时间:2019-09-21 15:26:11    阅读次数:96
hadoop集群提交代码
在hadoop集群中,写完了mapreduce并没有完成工作,还需要打jar包,然后将jar提交到集群中。hadoop提供了提交jar的入口。WordCount是写hadoop mapreduce入门级进程,会写wordcount的话,基本上80%的mapreduce就懂了。mapreduce分为m... ...
分类:其他好文   时间:2019-09-02 11:29:35    阅读次数:93
hadoop MapReduce自定义分区Partition输出各运营商的手机号码
MapReduce和自定义Partition MobileDriver主类 JobUtils工具类 Map自定义类 Reduce自定义类 Partition自定义分区类 ...
分类:移动开发   时间:2019-08-28 22:23:45    阅读次数:145
502条   上一页 1 2 3 4 5 ... 51 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!