搜索关键字：ambari hadoop hbase hive spark，搜索到26003个结果！码迷,mamicode.com！

Hadoop HA 配置

①编辑core-site.xml，添加内容如下：  <property> <name>fs.defaultFS</name> <value>hdfs://ns</value> </propert ...

分类：其他好文时间：2020-06-26 16:18:37 阅读次数：53

Hadoop

Hadoop 生态系统 Hbase：HBase 是一个建立在 HDFS 之上，面向列的 NoSQL 数据库，用于快速读 / 写大量数据，HBase 使用 Zookeeper 进行管理。 Zookeeper：用于 Hadoop 的分布式协调服务。Hadoop 的许多组件依赖于 Zookeeper，它运 ...

分类：其他好文时间：2020-06-26 14:54:11 阅读次数：64

Hive学习之路（一）Hive初识

目录 Hive 简介什么是Hive 为什么使用 Hive Hive 特点 Hive 和 RDBMS 的对比 Hive的架构 1、用户接口: shell/CLI, jdbc/odbc, webui Command Line Interface 2、跨语言服务： thrift server 提供了一 ...

分类：其他好文时间：2020-06-26 14:53:40 阅读次数：70

（一）hive远程模式搭建

一.集群规划 Name Master Slave1 Slave2 IP 192.168.2.98 192.168.2.99 192.168.2.100 Jdk版本 1.8.0.171 1.8.0.171 1.8.0.171 Hadoop版本 2.7.3 2.7.3 2.7.3 Hive版本 2.1. ...

分类：其他好文时间：2020-06-26 12:36:13 阅读次数：86

Hive学习(二)【数据类型、类型转换】

一.基本数据类型 HIVE MySQL JAVA 长度例子 TINYINT TINYINT byte 1byte有符号整数 2 SMALINT SMALINT short 2byte有符号整数 20 INT INT int 4byte有符号整数 20 BIGINT BIGINT long 8byt ...

分类：其他好文时间：2020-06-26 12:30:19 阅读次数：48

入门大数据---Spark累加器与广播变量

一、简介在 Spark 中，提供了两种类型的共享变量：累加器 (accumulator) 与广播变量 (broadcast variable)：累加器：用来对信息进行聚合，主要用于累计计数等场景；广播变量：主要用于在节点间高效分发大对象。二、累加器这里先看一个具体的场景，对于正常的累计求和 ...

分类：其他好文时间：2020-06-26 10:59:41 阅读次数：50

（一）Hbase全分布式搭建

一.集群规划 Name Master Slave1 Slave2 IP 192.168.2.98 192.168.2.99 192.168.2.100 Jdk版本 1.8.0.171 1.8.0.171 1.8.0.171 Zookeeper版本 3.4.10 3.4.10 3.4.10 Hadoo ...

分类：其他好文时间：2020-06-26 10:33:25 阅读次数：44

数据仓库 DWD数据明细层操作示例

DWD（Data Warehouse Detail）：数据明细层，结构和粒度与原始表保持一致，对ODS层数据进行清洗（取出空值、脏数据、超过极限范围的数据）。 DWD层的数据来源于ODS原始数据层，在原始数据层的Hive表里，只有一个字段，存储了原始的一条条日志信息，下面以事件（如商品点击事件，展示 ...

分类：其他好文时间：2020-06-26 01:33:52 阅读次数：262

Hive1.2.2（一）

一、安装一、课前准备 1. 安装好hadoop2.X版本的三节点集群，并配置好JAVA_HOME和HADOOP_HOME两个环境变量。二、课堂主题讲解hive1.2.2版本的三种常见安装部署模式三、课堂目标 1. 熟练搭建内嵌式hive环境 2. 熟练搭建本地式hive环境 3. 熟练搭建远 ...

分类：其他好文时间：2020-06-26 01:33:04 阅读次数：115

Kafka、Flume、Kinesis更多的流方式支持，包括Twitter、ZeroMQ等

特性如下：可线性伸缩至超过数百个节点；实现亚秒级延迟处理；可与Spark批处理和交互式处理无缝集成；提供简单的API实现复杂算法；更多的流方式支持，包括Kafka、Flume、Kinesis、Twitter、ZeroMQ等。原理 Spark在接收到实时输入数据流后，将数据划分成批次（di ...

分类：Web程序时间：2020-06-26 01:31:54 阅读次数：136

共26003条上一页 1 ... 75 76 77 78 79 ... 2601 下一页

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)