环境是hive和Hadoop 报错如:User: liwei is not allowed to impersonate anonymous 修改hadoop 配置文件 $HADOOP_HOME/etc/hadoop/core-site.xml <property> <name>hadoop.pro ...
分类:
编程语言 时间:
2021-01-27 13:53:02
阅读次数:
0
来源:https://mp.weixin.qq.com/s/Tb8GtabOVBvx88de0C4ncw 0 背景 在某些场景中,比如GROUP BY聚合之后的结果,需要去更新之前的结果值。这个时候,需要将 Kafka 消息记录的 key 当成主键处理,用来确定一条数据是应该作为插入、删除还是更新记 ...
分类:
数据库 时间:
2021-01-27 13:12:51
阅读次数:
0
引言 RDD 根据数据处理方式的不同将算子整体上分为 Value 类型、双 Value 类型和 Key-Value类型,本文主要讲一些Value 类型 正文 资源路径和资源内容 map ###函数签名:def map[U: ClassTag](f: T ? U): RDD[U] ###函数说明:将处 ...
分类:
其他好文 时间:
2021-01-27 12:50:51
阅读次数:
0
set hive.mapred.mode=nonstrict; 这是不严格模式,默认如此 对分区表进行查询,若在where子句中没有加分区的话,将禁止提交任务。 把属性值进行设置.默认值是没有开启的。默认是nonstrict 查看hive是否开启严格模式 set hive.mapred.mode 说 ...
分类:
其他好文 时间:
2021-01-26 12:44:54
阅读次数:
0
<!-- demodemo.xml --><dependency> <groupId>org.apache.hadoop</groupId> <artifactId>hadoop-mapreduce-client-core</artifactId> <version>2.7.0</version> ...
分类:
其他好文 时间:
2021-01-26 12:23:58
阅读次数:
0
删除数据库时提示:message:Database DBname is not empty. One or more tables exist. ##解决方案1: 先删除数据库中的所有表,再删除数据库 ##解决方案2: 强制删除 drop database db_hive cascade; ...
分类:
数据库 时间:
2021-01-26 11:44:00
阅读次数:
0
一、Python环境准备 远程服务器上Python版本要与本地想匹配,这里本地使用Anaconda来进行安装,远程服务器之间安装。 wget --no-check-certificate https://www.python.org/ftp/python/3.6.7/Python-3.6.7.tgz ...
分类:
编程语言 时间:
2021-01-25 11:30:39
阅读次数:
0
1 RDD基础知识 1.1 Spark的RDD五大特性 1.1.1 A list of partitions RDD是一个由多个partition(某个节点里的某一片连续的数据)组成的的List;将数据加载为RDD时,一般一个hdfs里的block会加载为一个partition。 对于RDD来说,每 ...
分类:
其他好文 时间:
2021-01-25 11:30:09
阅读次数:
0
#Hive 的函数 ##1.系统内置函数 1)查看系统自带的函数 show functions; show functions like "date"; 2)显示自带的函数的用法 desc function upper; desc function 'current_date' 记住带下划线的需要加 ...
分类:
其他好文 时间:
2021-01-25 11:02:17
阅读次数:
0
一、新增节点 语法 #其中-s 为有序节点,-e 临时节点 create [-s] [-e] path data 创建持久化节点并写入数据: # 创建hadoop节点并写入数据123456: create /hadoop "123456" 创建持久化有序节点,此时创建的节点名为指定节点名 + 自增序 ...
分类:
系统相关 时间:
2021-01-22 12:13:51
阅读次数:
0