搜索关键字：ambari hadoop hbase hive spark，搜索到26003个结果！码迷,mamicode.com！

01 Spark架构与运行流程

1. 阐述Hadoop生态系统中，HDFS, MapReduce, Yarn, Hbase及Spark的相互关系，为什么要引入Yarn和Spark。答: Hadoop对应于Google三驾马车：HDFS对应于GFS，即分布式文件系统，MapReduce即并行计算框架，HBase对应于BigTabl ...

分类：其他好文时间：2021-03-15 10:30:53 阅读次数：0

spark架构与运行流程

1. 阐述Hadoop生态系统中，HDFS, MapReduce, Yarn, Hbase及Spark的相互关系，为什么要引入Yarn和Spark。 Hadoop是一个能够对大量数据进行分布式处理的软件框架。具有可靠、高效、可伸缩的特点。 Hadoop的核心是HDFS和MapReduce，hadoo ...

分类：其他好文时间：2021-03-15 10:30:41 阅读次数：0

spark-sql-04-on_hive

设置metastore 机器： ke01、ke02、ke03、ke04 ke03 为元数据库 ke01、ke02、ke04 连接到元数据库、 hive-metastore搭建 ke03: <configuration> <property> <name>hive.metastore.warehou ...

分类：数据库时间：2021-03-12 13:42:56 阅读次数：0

Spark中join的类型

Spark的五种JOIN策略解析 JOIN操作是非常常见的数据处理操作，Spark作为一个统一的大数据处理引擎，提供了非常丰富的JOIN场景。本文分享将介绍Spark所提供的5种JOIN策略，希望对你有所帮助。本文主要包括以下内容：影响JOIN操作的因素 Spark中JOIN执行的5种策略 Spa ...

分类：其他好文时间：2021-03-10 13:42:57 阅读次数：0

hadoop集群安装

hadoop集群安装安装环境服务部署规划服务器IP node01 node02 node03 HDFS NameNode HDFS SecondaryNameNode HDFS DataNode DataNode DataNode YARN ResourceManager YARN NodeMa ...

分类：其他好文时间：2021-03-09 12:59:55 阅读次数：0

大数据实战-Hive-技巧实战

1.union 和 union all 前者可以去重 select sex,address from test where dt='20210218' union all select sex,address from test where dt='20210218'; + + +--+ | sex ...

分类：其他好文时间：2021-03-08 14:17:52 阅读次数：0

zookeeper集群搭建安装

hadoop大数据集群搭建过程中，需要使用到zookeeper进行主从管理和控制，那我们就安装一套集群环境 1、下载zookeeper 登录zookeeper.apache.org官网，找到Getting Started下边的Download。进去之后我们选择一个版本，比如选择3.6.2，进去后选 ...

分类：其他好文时间：2021-03-06 14:45:39 阅读次数：0

hadoop 配置历史服务器

配置文件 mapred-site.xml 加入以下代码  <property> <name>mapreduce.jobhistory.address</name> <value>hadoop102:10020</value> </property> <!-- 历史服 ...

分类：其他好文时间：2021-03-06 14:37:58 阅读次数：0

hadoop 集群崩溃操作办法

杀死进程 $HADOOP_HOME/sbin/stop-yarn.sh $HADOOP_HOME/sbin/stop-dfs.sh 删除所有节点 hadoop 根目录下的 data 和 logs rm -rf data/ logs/ 格式化在 hadoop 根目录下执行 hdfs namenode ...

分类：其他好文时间：2021-03-06 14:35:10 阅读次数：0

Spark性能调优-RDD算子调优篇（深度好文，面试常问，建议收藏）

RDD算子调优不废话，直接进入正题！ 1. RDD复用在对RDD进行算子时，要避免相同的算子和计算逻辑之下对RDD进行重复的计算，如下图所示：对上图中的RDD计算架构进行修改，得到如下图所示的优化结果： 2. 尽早filter 获取到初始RDD后，应该考虑尽早地过滤掉不需要的数据，进而减少对内 ...

分类：其他好文时间：2021-03-06 14:22:58 阅读次数：0

共26003条上一页 1 ... 20 21 22 23 24 ... 2601 下一页

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)