码迷,mamicode.com
首页 >  
搜索关键字:hive driver类    ( 5946个结果
hadoop2.7.3 词频统计
[hadoop@localhost mapreduce]$ hadoop jar hadoop-mapreduce-examples-2.7.3.jar wordcount /home/hadoop/data/input/sp.txt /home/hadoop/data/output/sp_2018... ...
分类:其他好文   时间:2018-12-25 20:20:15    阅读次数:218
Java 开发必会的 Linux 命令
原文链接:https://www.cnblogs.com/zhuawang/p/5212809.html Java 开发必会的 Linux 命令 作为一个Java开发人员,有些常用的Linux命令必须掌握。即时平时开发过程中不使用Linux(Unix)或者mac系统,也需要熟练掌握Linux命令。因 ...
分类:编程语言   时间:2018-12-24 22:35:30    阅读次数:226
Hive:map字段存储和取用 ( str_to_map函数 )
str_to_map(字符串参数, 分隔符1, 分隔符2) 使用两个分隔符将文本拆分为键值对。 分隔符1将文本分成K-V对,分隔符2分割每个K-V对。对于分隔符1默认分隔符是 ',',对于分隔符2默认分隔符是 '='。 例子: 1. 创建map字段 2. concat + str_to_map函数 ...
分类:其他好文   时间:2018-12-24 16:34:39    阅读次数:485
集群间数据迁移报错
[dip@dip003 ~]$ hadoop distcp -update /user/hive/warehouse/cslc.db/ hdfs://172.26.xx.xx:8020/user/hive/warehouse/cslc.db/18/12/24 10:27:06 ERROR tools ...
分类:其他好文   时间:2018-12-24 11:17:30    阅读次数:622
sqoop从oracle数据库抽取数据,导入到hive
环境: hadoop-2.7.5 sqoop-1.4.7 zookeeper-3.4.10 hive-2.3.3 (使用mysql配置元数据库) jdk1.8.0_151 oracle 11.2.0.3.0 经过一番baidu,总算初步成功,现在记录一下中间过程. 1.拷贝hive/conf/hiv ...
分类:数据库   时间:2018-12-24 03:01:23    阅读次数:232
Hive(10)-文件存储格式
Hive支持的存储数据的格式主要有:TEXTFILE 、SEQUENCEFILE、ORC、PARQUET 一. 列式存储和行式存储 左边为逻辑表,右边第一个为行式存储,第二个为列式存储 1. 行式存储的特点 查询满足条件的一整行数据的时候,列存储则需要去每个聚集的字段找到对应的每个列的值,行存储只需 ...
分类:其他好文   时间:2018-12-23 23:59:36    阅读次数:343
Linux安装RocketMQ
本文介绍Linux安装RocketMQ。 1.RocketMQ简介 RocketMQ是阿里巴巴中间件开发的分布式消息系统,曾经经历过很多阿里巴巴大型项目的实际检验。在去年已经正式捐献给Apache开源基金会,成为孵化项目。今年正式升级成为了apache的顶级项目。 RocketMQ官网地址为: "h ...
分类:系统相关   时间:2018-12-23 23:51:03    阅读次数:260
Hive和HBase的区别
1. 两者分别是什么? Apache Hive是一个构建在Hadoop基础设施之上的数据仓库。通过Hive可以使用HQL语言查询存放在HDFS上的数据。HQL是一种类SQL语言,这种语言最终被转化为Map/Reduce. 虽然Hive提供了SQL查询功能,但是Hive不能够进行交互查询--因为它只能 ...
分类:其他好文   时间:2018-12-23 22:15:11    阅读次数:210
hive学习04-员工部门表综合案例
知识点: 格式转换:cast(xxx as int) 按某列分桶某列排序,排序后打标机;例如:求每个地区工资最高的那个人的信息; ROW_NUMBER() OVER(PARTITION BY COLUMN ORDER BY COLUMN) row_number() over(distribute b ...
分类:其他好文   时间:2018-12-22 21:58:33    阅读次数:365
Flume-NG + HDFS + HIVE 日志收集分析
最近做了一个POC,目的是系统日志的收集和分析,此前有使用过splunk,虽然用户体验很好,但一是价格昂贵,二是不适合后期开发(splunk已经推出了SDK,后期开发已经变得非常容易)。在收集TB级别的日志量上flume-ng是更好的选择,因为后面的存储是扩展性极佳的HDFS。先简要介绍一下测试环境 ...
分类:Web程序   时间:2018-12-22 12:37:32    阅读次数:246
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!