搜索关键字：hadoop mapreduce java编程，搜索到18089个结果！码迷,mamicode.com！

Java编程题

题目： 1.用递归算法实现斐波那契数列（及其改进算法） 2.查找字符串中所有字符，第二次出现的位置情况，若没有出现，则赋值为-1 public class Test3 { /** * 查找字符串中所有字符，第二次出现的位置情况，若没有出现，则赋值为-1 * @param args */ public ...

分类：编程语言时间：2020-07-02 19:56:43 阅读次数：56

Hadoop框架

Hadoop的广义与狭义之分狭义的Hadoop:指的是一个框架，Hadoop是由三部分组成：HDFS:分布式文件系统--》存储；MapReduce:分布式离线计算框架--》计算；Yarn:资源调度框架广义的Hadoop:广义的Hadoop不仅仅包含Hadoop框架，除了Hadoop框架之外的一些 ...

分类：其他好文时间：2020-06-30 22:14:42 阅读次数：67

基于docker快速搭建hive环境

一、概述 Hive是什么？ Hive是一个数据仓库基础工具在Hadoop中用来处理结构化数据。它架构在Hadoop之上，总归为大数据，并使得查询和分析方便。最初，Hive是由Facebook开发，后来由Apache软件基金会开发，并作为进一步将它作为名义下Apache Hive为一个开源项目。它用 ...

分类：其他好文时间：2020-06-30 17:16:56 阅读次数：54

MapReduce模型中数据关联使用or语句导致计算效率低下

MapReduce计算模型中，如果两个数据集的关联，并不是通过数据集的一个唯一键和另一个数据集的一个唯一键关联，那么会导致大量数据分发到一个节点计算，使其效率极其低下。这里的MapReduce并不是仅仅是hive中的mapreduce模型，而是计算思想模型，比如spark、flink等，甚至更广阔 ...

分类：其他好文时间：2020-06-30 00:16:31 阅读次数：68

COMP9313 Lab1 SPARK pyspark 安装

遇到的问题： 1. SPARK & HADOOP 不能安装在有空格的目录下比如 programs file这种 2. 需要设置环境变量 PYSPARK_PYTHON PYSPARK_DRIVER_PYTHON 到3.6.5的环境，不然3.6 3.7会撞车 ...

分类：其他好文时间：2020-06-29 21:28:22 阅读次数：66

安装hadoop2.9.2 jdk1.8 centos7

安装JDK1.8 查看JDK1.8的安装 https://www.cnblogs.com/TJ21/p/13208514.html 安装hadoop 上传hadoop 下载hadoop 地址http://mirrors.hust.edu.cn/apache/hadoop/common/ 放到mkdi ...

分类：其他好文时间：2020-06-29 17:13:37 阅读次数：53

【Hadoop篇05】Hadoop配置集群时间同步

做任何事都要经受得挫折，要有恒心和毅力，满怀信心坚持到底 Hadoop配置集群事件同步时间同步方式找一台机器，作为时间服务器，所有的机器与这台集群时间进行定时的同步，比如，每隔十分钟，同步一次时间配置时间同步步骤 1.时间服务器配置（必须root用户） rpm -qa|grep ntp 2.修 ...

分类：其他好文时间：2020-06-29 17:07:37 阅读次数：45

spark-submit提交任务到yarn错误

1.Error initializing SparkContext. 20/06/29 05:52:43 INFO yarn.Client: Deleted staging directory hdfs://master:9000/user/hadoop/.sparkStaging/applicat ...

分类：其他好文时间：2020-06-29 15:02:48 阅读次数：96

归并排序和快速排序

1、归并排序基本思路：借助额外空间，合并两个有序数组，得到更长的有序数组。例如：「力扣」第 88 题：合并两个有序数组。算法思想：分而治之（分治思想）。「分而治之」思想的形象理解是「曹冲称象」、MapReduce，在一定情况下可以并行化。 public class Solution { // 归 ...

分类：编程语言时间：2020-06-28 18:15:49 阅读次数：60

Hadoop伪分布模式配置

Hadoop伪分布模式配置 Hadoop共有三种部署方式：本地模式，伪分布模式及集群模式；本次安装配置以伪分布模式为主，即在一台服务器上运行Hadoop（如果是分布式模式，则首先要配置Master主节点，其次配置Slave从节点）。以下说明如无特殊说明，默认使用root用户登录主节点，进行以下的一系 ...

分类：其他好文时间：2020-06-28 00:11:54 阅读次数：74

共18089条上一页 1 ... 40 41 42 43 44 ... 1809 下一页

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)