[toc] 同步: 题目 Farmer John has recently purchased a new car online, but in his haste he accidentally clicked the "Submit" button twice when selecting ex ...
分类:
其他好文 时间:
2019-06-24 18:16:29
阅读次数:
112
1、官方文档说法: Oracle支持在表空间(tablespace)、数据表(table)和分区(Partition)级别的压缩,如果设置为表空间级别,那么默认将该表空间中的全部的表都进行压缩。压缩操作可以在数据单条插入、数据修改和数据批量导入时发生。 As your database grows ...
分类:
数据库 时间:
2019-06-23 21:18:21
阅读次数:
145
收集hive的log hive的运行日志: /home/hadoop/CDH5.3.6/hive-0.13.1-cdh5.3.6/log/hive.log* memory*hdfs /user/flume/hive-log 1.需要四个包: 传到/home/hadoop/CDH5.3.6/flume ...
分类:
Web程序 时间:
2019-06-23 20:43:26
阅读次数:
119
Hive 自定义函数 UDF UDTF UDAF 1.UDF:用户定义(普通)函数,只对单行数值产生作用; UDF只能实现一进一出的操作。 定义udf 计算两个数最小值 public class Min extends UDF { public Double evaluate(Double a, D ...
分类:
其他好文 时间:
2019-06-23 15:36:00
阅读次数:
84
灵活使用spark强大的外部数据源功能,本文包括json、mysql、hive三种外部数据源
分类:
数据库 时间:
2019-06-22 23:39:59
阅读次数:
176
一 Spark SQL概述 1.1 什么是Spark SQL Spark SQL是Spark用来处理结构化数据的一个模块,它提供了一个编程抽象叫做DataFrame并且作为分布式SQL查询引擎的作用。 Hive是将Hive SQL转换成MapReduce然后提交到集群上执行,大大简化了编写MapRe ...
分类:
数据库 时间:
2019-06-22 19:45:45
阅读次数:
144
Linux服务器,查看日志发现程序无法继续写文件,但是用df -h查看磁盘容量还有剩余。 排查思路:怀疑是机器的inode节点被占满,使用df -i查看磁盘inode节点使用情况,果然是inode节点满了。 进行如下步骤进行排查: 1,df -i查看磁盘节点使用情况,查看到inode节点已满。 2, ...
分类:
其他好文 时间:
2019-06-21 14:26:30
阅读次数:
504
第一节:redis数据库介绍 概述 redis是一种支持分布式的nosql数据库,他的数据是保存在内存中,同时redis可以定时把内存数据同步到磁盘,即可以将数据持久化,并且他比memcached支持更多的数据结构(string,list列表[队列和栈],set[集合],sorted set[有序集 ...
分类:
其他好文 时间:
2019-06-21 13:07:56
阅读次数:
153
HiveQL与传统SQL区别 HiveQL是Hive的查询语言。与mysql的语言最接近,但还是存在于差异性,表现在:Hive不支持行级插入操作、更新操作和删除操作,不支持事物。 基本语法 数据库操作 # hadoop fs -ls /hive/warehouseFound 3 itemsdrwxr ...
分类:
其他好文 时间:
2019-06-21 12:51:56
阅读次数:
78