参考: https://blog.csdn.net/weixin_41879093/article/details/104216881 https://blog.csdn.net/qq_41140138/article/details/100833814 ...
分类:
编程语言 时间:
2020-04-01 19:24:01
阅读次数:
86
简介: get_json_object(string json_string, string path) 说明: 第一个参数填写json对象变量 第二个参数使用$表示json变量标识,然后用 . 或 [] 读取对象或数组;如果输入的json字符串无效,那么返回NULL。 每次只能返回一个数据项。 举 ...
分类:
Web程序 时间:
2020-04-01 17:48:41
阅读次数:
133
Hive + HBase,数据实时写Hbase,在Hive中用sql查询
分类:
其他好文 时间:
2020-04-01 14:37:17
阅读次数:
86
前提 Hive 需要是 2.0以上版本 Tez配置 下载好tar包后,将tar包上传到HDFS集群路径下 hadoop fs -put /opt/software/apache-tez-0.9.1-bin.tar.gz/ /tez 将Linux本机上的tar包解压 Hive配置 在hive/conf ...
分类:
其他好文 时间:
2020-03-31 22:43:48
阅读次数:
632
一、hive中表分为两种 1、内部表(管理表): 删除表的时候删除hdfs上的数据。 2、外部表 删除表的时候不删除hdfs上的数据。 外部表不能使用insert的方式插入数据,所有的数据来源,都是外部别人提供的,所以hive认为自己没有独占这份数据,所以删除hive表的时候,不会删 除表里面的数据 ...
分类:
其他好文 时间:
2020-03-31 19:14:39
阅读次数:
79
一、数据仓库的概念: 数据仓库,英文名称为Data Warehouse,可简写为DW或DWH。数据仓库的目的是构建面向分析的集成化数据环境,为企业提供决策支持(Decision Support)。它出于分析性报告和决策支持目的而创建。 数据仓库本身并不“生产”任何数据,同时自身也不需要“消费”任何的 ...
分类:
其他好文 时间:
2020-03-31 14:45:16
阅读次数:
77
sqoop导入导出问题 sqoop export --connect jdbc:mysql://ip:3306/eqpt_base_db?characterEncoding=utf8 --username root --password secret_password --table A_JQZ_T ...
分类:
数据库 时间:
2020-03-31 12:49:45
阅读次数:
130
传统Hive计算引擎为MapReduce,在Spark1.3版本之后,SparkSql正式发布,并且SparkSql与apachehive基本完全兼容,基于Spark强大的计算能力,使用Spark处理hive中的数据处理速度远远比传统的Hive快。在idea中使用SparkSql读取HIve表中的数据步骤如下1、首先,准备测试环境,将hadoop集群conf目录下的core-site.xml、hd
分类:
数据库 时间:
2020-03-30 14:42:50
阅读次数:
141
window系统 第一步 下载(www.mysql.com) (1)对应的系统版本 第二步 安装(解压) ZIP Archive(免安装版) 第三步 配置mysql服务 第三步 配置path环境变量 ...
分类:
数据库 时间:
2020-03-30 13:00:19
阅读次数:
52
1.框架选型 hadoop 3.1.3 hive 3.1.2 zookeeper 3.5.7 hbase 2.2.3 kafka_2.11 2.4.0 spark 2.4.5 bin hadoop2.7 2.安装前准备 1.关闭防火墙 2.安装 JDK 3.安装 Scala 4.配置ssh 免密 5 ...
分类:
其他好文 时间:
2020-03-30 00:06:39
阅读次数:
66