码迷,mamicode.com
首页 >  
搜索关键字:spark hadoop    ( 19685个结果
spark-sql-04-on_hive
设置metastore 机器: ke01、ke02、ke03、ke04 ke03 为元数据库 ke01、ke02、ke04 连接到元数据库 、 hive-metastore搭建 ke03: <configuration> <property> <name>hive.metastore.warehou ...
分类:数据库   时间:2021-03-12 13:42:56    阅读次数:0
Spark中join的类型
Spark的五种JOIN策略解析 JOIN操作是非常常见的数据处理操作,Spark作为一个统一的大数据处理引擎,提供了非常丰富的JOIN场景。本文分享将介绍Spark所提供的5种JOIN策略,希望对你有所帮助。本文主要包括以下内容: 影响JOIN操作的因素 Spark中JOIN执行的5种策略 Spa ...
分类:其他好文   时间:2021-03-10 13:42:57    阅读次数:0
hadoop集群安装
hadoop集群安装 安装环境服务部署规划 服务器IP node01 node02 node03 HDFS NameNode HDFS SecondaryNameNode HDFS DataNode DataNode DataNode YARN ResourceManager YARN NodeMa ...
分类:其他好文   时间:2021-03-09 12:59:55    阅读次数:0
zookeeper集群搭建安装
hadoop大数据集群搭建过程中,需要使用到zookeeper进行主从管理和控制,那我们就安装一套集群环境 1、下载zookeeper 登录zookeeper.apache.org官网,找到Getting Started下边的Download。 进去之后我们选择一个版本,比如选择3.6.2,进去后选 ...
分类:其他好文   时间:2021-03-06 14:45:39    阅读次数:0
hadoop 配置历史服务器
配置文件 mapred-site.xml 加入以下代码 <!-- 历史服务器端地址 --> <property> <name>mapreduce.jobhistory.address</name> <value>hadoop102:10020</value> </property> <!-- 历史服 ...
分类:其他好文   时间:2021-03-06 14:37:58    阅读次数:0
hadoop 集群崩溃操作办法
杀死进程 $HADOOP_HOME/sbin/stop-yarn.sh $HADOOP_HOME/sbin/stop-dfs.sh 删除所有节点 hadoop 根目录下的 data 和 logs rm -rf data/ logs/ 格式化 在 hadoop 根目录下执行 hdfs namenode ...
分类:其他好文   时间:2021-03-06 14:35:10    阅读次数:0
Spark性能调优-RDD算子调优篇(深度好文,面试常问,建议收藏)
RDD算子调优 不废话,直接进入正题! 1. RDD复用 在对RDD进行算子时,要避免相同的算子和计算逻辑之下对RDD进行重复的计算,如下图所示: 对上图中的RDD计算架构进行修改,得到如下图所示的优化结果: 2. 尽早filter 获取到初始RDD后,应该考虑尽早地过滤掉不需要的数据,进而减少对内 ...
分类:其他好文   时间:2021-03-06 14:22:58    阅读次数:0
mac搭建hadoop环境
参考:https://blog.csdn.net/vbirdbest/article/details/88189753 安装步骤 1. 修改主机名 sudo scutil --set HostName localhost 2. ssh免密登录 具体配置方法: (1)ssh-keygen -t rsa ...
分类:系统相关   时间:2021-03-06 14:17:50    阅读次数:0
Spark Core 02(理论),独立的进程集
Application Application=a driver program + executors 一般来说:1个SparkContext = 1个application=1个SparkShell Spark提交任务不一定须在集群里提交,有gateway就行 1个application ==> ...
分类:系统相关   时间:2021-03-04 13:20:14    阅读次数:0
基于hdfs文件创建hive表
create table customer row format SERDE 'org.apache.hadoop.hive.serde2.avro.AvroSerDe'stored as inputformat 'org.apache.hadoop.hive.ql.io.avro.AvroCont ...
分类:其他好文   时间:2021-03-03 12:21:19    阅读次数:0
19685条   上一页 1 ... 15 16 17 18 19 ... 1969 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!