删除数据库时提示:message:Database DBname is not empty. One or more tables exist. ##解决方案1: 先删除数据库中的所有表,再删除数据库 ##解决方案2: 强制删除 drop database db_hive cascade; ...
分类:
数据库 时间:
2021-01-26 11:44:00
阅读次数:
0
#Hive 的函数 ##1.系统内置函数 1)查看系统自带的函数 show functions; show functions like "date"; 2)显示自带的函数的用法 desc function upper; desc function 'current_date' 记住带下划线的需要加 ...
分类:
其他好文 时间:
2021-01-25 11:02:17
阅读次数:
0
文章目录 1.Trino与Spark SQL的区别分析 2.Trino与Spark SQL解析过程对比 3.Trino基本概念 4.Trino架构 5.Trino SQL执行流程 6.Trino Task执行流程 相关参考: 1.Trino与Spark SQL的区别分析 2.Trino与Spark ...
分类:
其他好文 时间:
2021-01-22 12:05:01
阅读次数:
0
HBase 虽然可以存储数亿或数十亿行数据,但是对于数据分析来说,不太友好,只提供了简单的基于 Key 值的快速查询能力,没法进行大量的条件查询。现有hbase的查询工具有很多如:Hive,Tez,Impala,Shark/Spark,Phoenix等。今天主要说Hive,Hive方便地提供了Hiv ...
分类:
其他好文 时间:
2021-01-21 10:54:30
阅读次数:
0
# 先定义dataframe各列的数据类型 from pyspark.sql.types import *schema = StructType([ StructField("a", NullType(), True), StructField("b", AtomicType(), True), S ...
分类:
其他好文 时间:
2021-01-18 11:29:36
阅读次数:
0
1.数据格式 1 2 x2 2 x3 2 x4 2 x 2.创建表 创建TEXTFILE格式的表 CREATE TABLE test_txt(id int,num int,txt string) ROW FORMAT DELIMITED FIELDS TERMINATED BY '\t' LINES ...
分类:
其他好文 时间:
2021-01-18 10:51:25
阅读次数:
0
1. 设置执行引擎 set hive.execution.engine=mr;set hive.execution.engine=spark; 如果设置执行引擎为MR,那么调用Hadoop的maprecude来运行需要执行的job的程序; 如果设置执行引擎为spark,那么就会调用spark来执行任 ...
分类:
其他好文 时间:
2021-01-15 12:15:21
阅读次数:
0
工作中有一张类型信息表,有时候需要不同的类型信息需要多次扫描这张表,表很大的时候影响效率。 优化前: select t1.fa_id,t2.srch_char_val,t3.srch_char_val from (select fa_id from cisadm_ods.ods_cis_ci_fa_ ...
分类:
其他好文 时间:
2021-01-13 10:40:03
阅读次数:
0
一、Linux常用命令 文件处理相关 目录处理命令 命令格式 命令格式:命令 [-选项] [参数] 例:ls -la /etc 说明: 1)个别命令使用不遵循此格式 2)当有多个选项时,可以写在一起 3)简化选项与完整选项 a等于 --all 命令名称:ls 命令英文原意:list 命令所在路径:/ ...
分类:
系统相关 时间:
2021-01-12 10:30:58
阅读次数:
0
* 如果是非Ubuntu系统,下面的apt-get命令要换成yum命令。apt-cache search all | grep -> yum list installed | grepapt-get purge -y -> yum remove -y其中的参数-y是过程中所有提示都自动选yes的作用 ...
分类:
其他好文 时间:
2021-01-07 12:30:42
阅读次数:
0