搜索关键字：hive udf，搜索到6169个结果！码迷,mamicode.com！

window系统第一步下载（www.mysql.com） (1)对应的系统版本第二步安装（解压） ZIP Archive（免安装版）第三步配置mysql服务第三步配置path环境变量 ...

分类：数据库时间：2020-03-30 13:00:19 阅读次数：52

大数据平台搭建：Hadoop-3.1.3+Hive-3.1.2+HBase-2.2.3+Zookeeper-3.5.7+Kafka_2.11-2.4.0+Spark-2.4.5

1.框架选型 hadoop 3.1.3 hive 3.1.2 zookeeper 3.5.7 hbase 2.2.3 kafka_2.11 2.4.0 spark 2.4.5 bin hadoop2.7 2.安装前准备 1.关闭防火墙 2.安装 JDK 3.安装 Scala 4.配置ssh 免密 5 ...

分类：其他好文时间：2020-03-30 00:06:39 阅读次数：66

Hive优化

整体架构优化点: 根据不同业务需求进行日期分区, 并执行类型动态分区。 hive.exec.dynamic.partition=true 为了减少磁盘存储空间以及I/O次数, 对数据进行压缩(Gzip) mapreduce.output.fileoutputformat.compress=true ...

分类：其他好文时间：2020-03-29 19:55:40 阅读次数：105

Hive中三种方式删除表数据内容

使用truncate仅可删除内部表数据，不可删除表结构 truncate table 表名（truncate可删除所有的行，但是不能删除外部表）使用shell命令删除外部表 hdfs -dfs -rm -r 外部表路径使用 drop 可删除整个表 drop table 表名 ...

分类：其他好文时间：2020-03-28 20:08:48 阅读次数：72

KVM之KVM安装部署

KVM是指基于Linux内核的虚拟机（Virtual Machine）。KVM主要在于它是与Linux内核集成的，所以速度很快。KVM的宿主操作系统必须是Linux，支持的客户机操作系统包括Linux、Windows、Solaris和BSD，运行在支持虚拟化扩展的x86和x86_64硬件架构上,cpu支持VT技术。

分类：其他好文时间：2020-03-27 17:06:19 阅读次数：91

python 连接使用LDAP认证的hive

主要使用pyhive包。使用linux中的普通账号，venv环境。python版本 3.6.4。 ldap认证需要sasl包，在安装sasl包的时候因为机器中没有g++编译器，导致无法安装。因为我使用的普通账号，没法给服务器安装g++编译器，解决的方案是在另一台机器中安装sasl，将安装完成后生成 ...

分类：编程语言时间：2020-03-27 17:04:09 阅读次数：206

SparkSession 与SparkContext

SparkSession： SparkSession实质上是SQLContext和HiveContext的组合（未来可能还会加上StreamingContext），所以在SQLContext和HiveContext上可用的API在SparkSession上同样是可以使用的。 SparkSession ...

分类：其他好文时间：2020-03-27 16:48:03 阅读次数：46

sqoop oracle到hive，动态分区一次操作记录

sqoop，将oracle数据传递到hive，可以直接将表数据覆盖传递，也可以按select传递，这里我用的是select查询的脚本如下： 1、创建分区表，按c1分区 CREATE TABLE `xx.cc`( `c1` string) PARTITIONED BY(`c2` string); 2 ...

分类：数据库时间：2020-03-27 14:25:12 阅读次数：214

利用hive-hbase表做hive表快速入库hbase功能,纬度表的查询

有个需求是纬度表需要秒出数据,首先表刚好也是1-1批对的情况,首先想到了利用hbase的索引机制。（表数据大概在4--30E之间）虽然网上有很多直接建立hive表,自动创建hbase表的例子,但是这种情况不能进行hbase表的region预分区,导致热点问题比较严重。所以hive和hbase表要分 ...

分类：其他好文时间：2020-03-26 13:56:37 阅读次数：103

Hive的安装部署全过程详细版

首先先简单介绍下hive： Hive是一个基于Hadoop的数据仓库工具，可以将结构化的数据文件映射成一张数据表，并可以使用类似SQL的方式来对数据文件进行读写以及管理。这套Hive SQL 简称HQL。Hive的执行引擎可以是MR、Spark、Tez。核心架构： Hive官网地址 http:// ...

分类：其他好文时间：2020-03-26 01:39:24 阅读次数：93

共6169条上一页 1 ... 46 47 48 49 50 ... 617 下一页

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)