题目: 1.用递归算法实现斐波那契数列(及其改进算法) 2.查找字符串中所有字符,第二次出现的位置情况,若没有出现,则赋值为-1 public class Test3 { /** * 查找字符串中所有字符,第二次出现的位置情况,若没有出现,则赋值为-1 * @param args */ public ...
分类:
编程语言 时间:
2020-07-02 19:56:43
阅读次数:
56
Hadoop的广义与狭义之分 狭义的Hadoop:指的是一个框架,Hadoop是由三部分组成:HDFS:分布式文件系统--》存储;MapReduce:分布式离线计算框架--》计算;Yarn:资源调度框架 广义的Hadoop:广义的Hadoop不仅仅包含Hadoop框架,除了Hadoop框架之外的一些 ...
分类:
其他好文 时间:
2020-06-30 22:14:42
阅读次数:
67
一、概述 Hive是什么? Hive是一个数据仓库基础工具在Hadoop中用来处理结构化数据。它架构在Hadoop之上,总归为大数据,并使得查询和分析方便。 最初,Hive是由Facebook开发,后来由Apache软件基金会开发,并作为进一步将它作为名义下Apache Hive为一个开源项目。它用 ...
分类:
其他好文 时间:
2020-06-30 17:16:56
阅读次数:
54
MapReduce计算模型中,如果两个数据集的关联,并不是通过数据集的一个唯一键和另一个数据集的一个唯一键关联,那么会导致大量数据分发到一个节点计算,使其效率极其低下。 这里的MapReduce并不是仅仅是hive中的mapreduce模型,而是计算思想模型,比如spark、flink等,甚至更广阔 ...
分类:
其他好文 时间:
2020-06-30 00:16:31
阅读次数:
68
遇到的问题: 1. SPARK & HADOOP 不能安装在有空格的目录下 比如 programs file这种 2. 需要设置环境变量 PYSPARK_PYTHON PYSPARK_DRIVER_PYTHON 到3.6.5的环境,不然3.6 3.7会撞车 ...
分类:
其他好文 时间:
2020-06-29 21:28:22
阅读次数:
66
安装JDK1.8 查看JDK1.8的安装 https://www.cnblogs.com/TJ21/p/13208514.html 安装hadoop 上传hadoop 下载hadoop 地址http://mirrors.hust.edu.cn/apache/hadoop/common/ 放到mkdi ...
分类:
其他好文 时间:
2020-06-29 17:13:37
阅读次数:
53
做任何事都要经受得挫折,要有恒心和毅力,满怀信心坚持到底 Hadoop配置集群事件同步 时间同步方式 找一台机器,作为时间服务器,所有的机器与这台集群时间进行定时的同步,比如,每隔十分钟,同步一次时间 配置时间同步步骤 1.时间服务器配置(必须root用户) rpm -qa|grep ntp 2.修 ...
分类:
其他好文 时间:
2020-06-29 17:07:37
阅读次数:
45
1.Error initializing SparkContext. 20/06/29 05:52:43 INFO yarn.Client: Deleted staging directory hdfs://master:9000/user/hadoop/.sparkStaging/applicat ...
分类:
其他好文 时间:
2020-06-29 15:02:48
阅读次数:
96
1、归并排序 基本思路:借助额外空间,合并两个有序数组,得到更长的有序数组。例如:「力扣」第 88 题:合并两个有序数组。 算法思想:分而治之(分治思想)。「分而治之」思想的形象理解是「曹冲称象」、MapReduce,在一定情况下可以并行化。 public class Solution { // 归 ...
分类:
编程语言 时间:
2020-06-28 18:15:49
阅读次数:
60
Hadoop伪分布模式配置 Hadoop共有三种部署方式:本地模式,伪分布模式及集群模式;本次安装配置以伪分布模式为主,即在一台服务器上运行Hadoop(如果是分布式模式,则首先要配置Master主节点,其次配置Slave从节点)。以下说明如无特殊说明,默认使用root用户登录主节点,进行以下的一系 ...
分类:
其他好文 时间:
2020-06-28 00:11:54
阅读次数:
74