码迷,mamicode.com
首页 >  
搜索关键字:HIVE    ( 5904个结果
HUE 配置参数优化
1、图形页面表展示限制为5000,业务需要进行调整。参数如下/opt/cloudera/parcels/CDH-5.14.2-1.cdh5.14.2.p0.3/lib/hue/apps/beeswax/src/beeswax/server/hive_server2_lib.py744max_rows=5000754max_rows=5000771max_rows=5000784max_rows=5
分类:其他好文   时间:2020-04-08 12:28:37    阅读次数:327
Hive建表-分隔符
在hive建表中,默认的分隔符为 ‘,’ ,可以指定想用的分隔符 hive默认的列分割类型为org.apache.hadoop.hive.serde2.lazy.LazySimpleSerDe,这其实就是^A分隔符,hive中默认使用^A(ctrl+A)作为列分割符,如果用户需要指定的话,等同于ro ...
分类:其他好文   时间:2020-04-08 11:40:18    阅读次数:267
hive数据库如何去重,去除相同的一模一样的数据
问题:发现存在一张表中存在相同的两行数据 得到:仅仅保留一行数据 方法: 原理-我们通过 1 select count (字段1,字段2) from 表1; 2 3 结果 200条数据 4 5 select count (distinct 字段1,字段2) from 表1; 6 7 结果 100条数 ...
分类:数据库   时间:2020-04-08 09:54:03    阅读次数:487
zabbix 部署windos
下载https://www.zabbix.com/download_agents?version=4.4&release=4.4.7&os=Windows&os_version=Any&hardware=amd64&encryption=No+encryption&packaging=Archive安装Windows安装zabbixagent解压到D
分类:Windows程序   时间:2020-04-07 20:37:13    阅读次数:95
SQOOP增量抽取时,在HIVE中实现类似Oracle的merge操作
数据仓库建设中的数据抽取环节,常常需要增量抽取业务库数据。但业务库数据不是一层不变的,会根据时间发生状态变更,那么就需要同步更新变化数据到HIVE中。过去在Oracle上做数据仓库时,可以使用merge的方法合并新老数据。但hive中没有该功能,本文旨在通过sqoop抽取后,自动实现数据合并。 表设 ...
分类:数据库   时间:2020-04-07 18:32:57    阅读次数:99
hive、Hbase、mysql的区别(转)
hive、Hbase、mysql的区别 1、Hive和HBase的区别 1)hive是sql语言,通过数据库的方式来操作hdfs文件系统,为了简化编程,底层计算方式为mapreduce。 2)hive是面向行存储的数据库。 3)Hive本身不存储和计算数据,它完全依赖于HDFS和MapReduce, ...
分类:数据库   时间:2020-04-06 20:39:58    阅读次数:71
redis的安装
下载地址:https://github.com/MicrosoftArchive/redis/releases 安装过程: 临时服务安装:也就是网上说的 不能关闭窗口,再另打开一个窗口 1.打开cmd窗口,使用 cd 命令切换目录到 当前解压的redis文件路径运行,(如果想方便的话,可以设置环境变 ...
分类:其他好文   时间:2020-04-06 13:56:31    阅读次数:88
上周热点回顾(3.30-4.5)
热点随笔: · 你所不知道的 C# 中的细节 (hez2010)· 2020年了,跨平台开发框架现在怎样了? (葡萄城技术团队)· 坚持写作快两年了,有些私藏工具跟你们分享 (楼下小黑哥)· 从入门到精通-Nginx,图文并茂、负载均衡、动静分离、虚拟主机 附案例源码 (陈彦斌)· 高效code r ...
分类:其他好文   时间:2020-04-06 09:38:31    阅读次数:74
【赵强老师】在Spark SQL中读取JSON文件
Spark SQL是Spark用来处理结构化数据的一个模块,它提供了一个编程抽象叫做DataFrame并且作为分布式SQL查询引擎的作用。为什么要学习Spark SQL?如果大家了解Hive的话,应该知道它是将Hive SQL转换成MapReduce然后提交到集群上执行,大大简化了编写MapRedu ...
分类:数据库   时间:2020-04-05 13:33:32    阅读次数:113
hadoop-ha+zookeeper+hbase+hive+sqoop+flume+kafka+spark集群安装
创建3台虚拟机 主机为桌面版 其他为迷你版本 ******************************常用命令、进程名称****************************启动集群命令: start-all.sh启动zookeeper: zkServer.sh start 启动journal ...
分类:Web程序   时间:2020-04-05 00:40:06    阅读次数:101
5904条   上一页 1 ... 40 41 42 43 44 ... 591 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!