搜索关键字：mapreduce partitioner，搜索到4100个结果！码迷,mamicode.com！

用Matlab对导出的数据进行可视化

我这里是MapReduce导出的数据，MapReduce导出的数据中，Key和Value之间用制表符分隔的，可以直接作为表格型数据进行操作，复制一下导出的数据 1. 首先在Matlab工作区创建一个元胞型的变量 2. 然后复制导出的数据 3. 在变量区选择，粘贴Excel数据，就创建好了如图所示 ...

分类：其他好文时间：2020-06-26 22:08:29 阅读次数：80

入门大数据---Spark_Streaming与流处理

一、流处理 1.1 静态数据处理在流处理之前，数据通常存储在数据库，文件系统或其他形式的存储系统中。应用程序根据需要查询数据或计算数据。这就是传统的静态数据处理架构。Hadoop 采用 HDFS 进行数据存储，采用 MapReduce 进行数据查询或分析，这就是典型的静态数据处理架构。 1.2 流 ...

分类：其他好文时间：2020-06-26 20:02:43 阅读次数：49

Hive1.2.2（五）优化

1、hive的企业级调优 1.1 Fetch抓取（鸡肋） Fetch抓取是指，==Hive中对某些情况的查询可以不必使用MapReduce计算== 例如：select * from employee; 在这种情况下，Hive可以简单地读取employee对应的存储目录下的文件，然后输出查询结果到控制 ...

分类：其他好文时间：2020-06-26 18:44:35 阅读次数：56

kafka2.5.0自定义分区器

自定义分区器： import org.apache.kafka.clients.producer.Partitioner; import org.apache.kafka.common.Cluster; import org.apache.kafka.common.PartitionInfo; im ...

分类：其他好文时间：2020-06-25 15:30:00 阅读次数：55

MapReduce并行编程模型

一、课前准备 1. 3节点hadoop集群 2. 安装IDEA 3. 安装maven并配置环境变量二、课堂主题 1. 围绕MapReduce分布式计算讲解三、课堂目标 1. 理解MapReduce编程模型 2. 独立完成一个MapReduce程序并运行成功 3. 了解MapReduce工程流程 ...

分类：其他好文时间：2020-06-24 00:32:41 阅读次数：54

批处理引擎MapReduce

1、MapReduce是一个经典的分布式批处理计算引擎，被广泛应用于搜索引擎索引构建、大规模数据处理等场景中，具有易于编程、良好的扩展性与容错性以及高吞吐率等特点。它主要由两部分组成：编程模型和运行时环境。其中，编程模型为用户提供了非常易用的编程接口，用户只需像编写串行程序一样实现几个简单的函数即可 ...

分类：其他好文时间：2020-06-23 17:10:23 阅读次数：48

Hadoop MapReduce

一、概述 1.是Hadoop中的一套分布式的计算框架 2.将整个计算过程拆分为2个阶段：Map阶段、Reduce阶段 3.Map阶段一般负责数据的整理，Reduce阶段负责数据的汇总 4.如果输入路径是一个文件，则MapReduce只处理这个文件；如果输入的是一个目录，则处理这个目录下的所有文件 - ...

分类：其他好文时间：2020-06-23 15:36:59 阅读次数：38

配置文件说明

默认配置文件要获取的默认配置文件文件存放在Hadoop的jar包中的位置自定义配置文件[etc/hadoop]中 [core-default.xml] hadoop-common-2.10.0.jar/core-default.xml [core-site.xml] [hdfs-default ...

分类：其他好文时间：2020-06-22 12:33:23 阅读次数：48

大数据结构生态体系

数据来源层数据库日志视频，ppt 数据传输层 Sqoop数据传递 Flume日志收集 kafka消息队列数据存储层 HDFS文件存储 HBase非关系型数据库 kafka（存储少量数据）资源管理层 YARN资源管理数据计算层 MapReduce离线计算 Hive数据查询 Mahout数据 ...

分类：其他好文时间：2020-06-22 00:56:04 阅读次数：83

hadoop组成

1.x MapReduce：计算+调度 HDFS：数据存储 Common：辅助工具 2.x MapReduce：计算 Yarn：资源调度 HDFS：数据存储 Common：辅助工具 ...

分类：其他好文时间：2020-06-21 23:45:14 阅读次数：83

共4100条上一页 1 ... 10 11 12 13 14 ... 410 下一页

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)