尚硅谷大数据技术之Sqoop 第1章 Sqoop简介 Sqoop是一款开源的工具,主要用于在Hadoop(Hive)与传统的数据库(mysql、postgresql...)间进行数据的传递,可以将一个关系型数据库(例如 : MySQL ,Oracle ,Postgres等)中的数据导进到Hadoop ...
分类:
其他好文 时间:
2019-06-16 09:48:51
阅读次数:
178
1. Hive 基本概念 1.1 Hive 介绍 Hive 由 Facebook 开源用于解决海量结构化日志的数据统计; Hive 是基于 Hadoop 的一个数据仓库工具,可以将结构化的数据文件映射为一张表,并提供 类SQL 查询功能; 本质是:将 HQL 转化成 MapReduce 程序 ; 1 ...
分类:
其他好文 时间:
2019-06-14 23:48:16
阅读次数:
123
一、生成HTML字符串 二、解析HTML字符串或本地html文件 三、解析处理结合XPath使用更加方便 XPath简明介绍 XPath 使用路径表达式来选取 XML 文档中的节点或节点集。节点是通过沿着路径 (path) 或者步 (steps) 来选取的。 下面列出了最有用的路径表达式: node ...
hive: 基于hadoop,数据仓库软件,用作OLAP OLAP:online analyze process 在线分析处理OLTP:online transaction process 在线事务处理 事务: ACID A:atomic 原子性 C: consistent 一致性 I:isolat ...
分类:
其他好文 时间:
2019-06-14 16:16:24
阅读次数:
88
提示说是因为远程问题,直接给出的提示即可。 已经告诉我们,使用 将安全模型关闭,但是关闭安全模式之后发现再次执行同样的语句还是得到同样的结果,查阅资料,是因为内存空间不足导致的。 ...
分类:
其他好文 时间:
2019-06-14 12:34:29
阅读次数:
141
hive https://baike.baidu.com/item/hive/67986?fr=aladdin hadoop https://baike.baidu.com/item/Hadoop/3526507?fr=aladdin http://baijiahao.baidu.com/s?id= ...
分类:
其他好文 时间:
2019-06-12 10:44:20
阅读次数:
71
Hive的hql注意事项 1、使用分区裁剪,列裁剪 在分区剪裁中,当使用外关联时,如果将副表的过滤条件写在Where后面,那么就会先全表关联,之后再过滤, SELECT a.id FROM lxw1234_a a left outer joint_lxw1234_partitioned b ON ( ...
分类:
其他好文 时间:
2019-06-11 19:38:45
阅读次数:
136
(一)Hive 概述 (二)Hive在Hadoop生态圈中的位置 (三)Hive 架构设计 (四)Hive 的优点及应用场景 (五)Hive 的下载和安装部署 1.Hive 下载 Apache版本的Hive。 Cloudera版本的Hive。 这里选择下载Apache稳定版本apache-hive- ...
分类:
其他好文 时间:
2019-06-11 19:11:36
阅读次数:
139
https://www.cnblogs.com/MOBIN/p/5702580.html ...
分类:
其他好文 时间:
2019-06-11 19:11:08
阅读次数:
181