码迷,mamicode.com
首页 >  
搜索关键字:hive on spark    ( 12366个结果
01 大数据概述
1.用图表描述Hadoop生态系统的各个组件及其关系。 2.阐述Hadoop生态系统中,HDFS, MapReduce, Yarn, Hbase及Spark的相互关系。 Hadoop对应于Google三驾马车:HDFS对应于GFS,即分布式文件系统,MapReduce即并行计算框架,HBase对应于 ...
分类:其他好文   时间:2021-03-02 12:10:47    阅读次数:0
Java继承和重写
继承的本质是对某一批类的抽象,从面实现对现实世界更好的建模. extends的意思是"扩展".子类是父类的扩展. JAVA中类只有单继承,没有多继承! 继承是类和类之间的一种关系.除此之外,类和类之间的关系还有依赖,组合,聚合等. 继承关系的俩个类,一个为子类(派生类,),一个为父类(基类).子类继 ...
分类:编程语言   时间:2021-02-27 13:29:46    阅读次数:0
[Spark] pyspark insertInto 去重插入数据表
pyspark有个bug, 虽然下面代码写了 write.mode("overwrite")但是不生效 spark.conf.set("hive.exec.dynamic.partition.mode", "constrict") db_df.repartition(1).write.mode("o ...
分类:其他好文   时间:2021-02-23 14:14:20    阅读次数:0
hive导数据
在hive客户端建一张表比如bb 条件bb与abc表结构相同,abc有数据,把abc的数据导到bb里 hive -e是为了解决每次进入客户端的麻烦操作,使用了hive -e命令,可以在hive客户端外对客户端进行操作, 例如 hive -e "use aaa;select * from abc li ...
分类:其他好文   时间:2021-02-22 12:21:51    阅读次数:0
hive的数据类型
hive的数据类型分为基本数据类型,数字类型,字符串类型 基本数据类型包括 TINYINT, SMALLINT, INT/INTEGER, BIGINT, FLOAT, DOUBLE, DECIMAL, BOOLEAN, BINARY hive的数字类型 分为整数类型,浮点数类型 hive的字符串类 ...
分类:其他好文   时间:2021-02-22 11:50:45    阅读次数:0
HDFS某个节点的磁盘满了
前言 昨天还是周末,公司群里就有人@,说集群有问题了,敲完Hive一直卡在那里进不去,于是我很快登上WebUi,看到了这么一幕:这台节点的磁盘满了,其他的数据分布都比较平均 为什么会这样 这里就不得不说一下HDFS复本存放策略了: namenode如何选择在哪个datanode存储复本(replic ...
分类:其他好文   时间:2021-02-20 12:16:37    阅读次数:0
一篇文章了解Hbase和Hive
##Hbase和Hive Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供简单的sql查询功能,可以将sql语句转换为MapReduce任务进行运行。HBase是Hadoop的数据库,一个分布式、可扩展、大数据的存储。单个的从字面意思上或许很难看出二者的 ...
分类:其他好文   时间:2021-02-19 12:52:56    阅读次数:0
Spark07-SparkSQL
在介绍 Spark SQL之前,我们先了解两种基本的数据分析方式。 一、数据分析的两种方式 数据分析的方式大致上可以划分为 SQL 和 命令式两种。 命令式 在前面的 RDD部分,非常明显可以感觉的到是命令式的,主要特征是通过一个算子,可以得到一个结果,通过结果再进行后续计算。例如: sc.para ...
分类:数据库   时间:2021-02-16 12:29:50    阅读次数:0
大数据开发-从cogroup的实现来看join是宽依赖还是窄依赖
前面一篇文章提到大数据开发-Spark Join原理详解,本文从源码角度来看cogroup 的join实现 1.分析下面的代码 import org.apache.spark.rdd.RDD import org.apache.spark.{SparkConf, SparkContext} obje ...
分类:其他好文   时间:2021-02-16 12:23:59    阅读次数:0
20-Hive常见报错处理
Hive 运行过程异常信息有时不能完全显示在终端上,此时可以用 Hive Debug 模 式进行调试 hive --hiveconf hive.root.logger=INFO,console 1、表不存在 FAILED: SemanticException [Error 10001]: Line ...
分类:其他好文   时间:2021-02-10 13:39:36    阅读次数:0
12366条   上一页 1 ... 15 16 17 18 19 ... 1237 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!