搜索关键字：ambari hadoop hbase hive spark，搜索到26003个结果！码迷,mamicode.com！

3（Hive）

1，简介 Hive : 数据仓库。Hive：解释器，编译器，优化器等。Hive 运行时，元数据存储在关系型数据库里面 2，架构（1）用户接口主要有三个：CLI，Client 和 WUI。其中最常用的是CLI，Cli启动的时候，会同时启动一个Hive副本。Client是Hive的客户端，用户连接至H ...

分类：其他好文时间：2020-07-30 01:33:30 阅读次数：77

Python连接Impala

Impyla是用于分布式查询引擎的HiveServer2实现(如Impala、Hive)的python客户端 1)安装impyla pip install impyla 安装报错解决办法：根据提示下载对应的工具 https://visualstudio.microsoft.com/zh-hans ...

分类：编程语言时间：2020-07-29 21:58:39 阅读次数：103

深入HBase读写

在了解HBase架构的基础上，我们需要进一步学习HBase的读写过程，一方面是了解各个组件在整个读写过程中充当的角色，另一方面只有了解HBase的真实请求过程，才能为后续的正确使用打下初步基础，毕竟，除了会使用api，你还得知道怎么能写得更快，怎么查得更快。

分类：其他好文时间：2020-07-29 10:38:20 阅读次数：88

Spark 数据处理相关代码

<dependency> <groupId>org.apache.spark</groupId> <artifactId>spark-core_2.11</artifactId> <version>2.3.3</version> </dependency> <!-- https://mvnrepos ...

分类：其他好文时间：2020-07-29 09:53:42 阅读次数：61

大数据学习5（基于yarn的高可用集群搭建）

NN-1 NN-2 DN ZK ZKFC JNN RS NM(和DN在一起) node0001 * * * node0002 * * * * * * node0003 * * * * * node0004 * * * * 1，修改配置文件 cd /opt/sxt/hadoop-2.6.5/etc/h ...

分类：其他好文时间：2020-07-29 00:45:28 阅读次数：156

数据可视化之-superset

第1章 Superset安装及使用 Apache Superset是一个开源的、现代的、轻量级BI分析工具，能够对接多种数据源、拥有丰富的图标展示形式、支持自定义仪表盘，且拥有友好的用户界面，十分易用。由于Superset能够对接常用的大数据分析工具，如Hive、Kylin、Druid等，且支持自 ...

分类：其他好文时间：2020-07-29 00:42:59 阅读次数：103

《hadoop 集群搭建、spark安装、Hbase安装、Hive安装、Kafka安装》

1 hadoop集群安装 https://blog.csdn.net/shshheyi/article/details/84893371 1.1 修改主机名 [root@localhost ~]# vim /etc/hosts # 三台机器都需要操作 192.168.28.131 master 19 ...

分类：其他好文时间：2020-07-29 00:41:18 阅读次数：111

spark系列之基本概念

Spark的架构图 1、RDD(弹性分布式数据集) RDD是对象的分布式集合。 RDD以并行方式应用和记录数据转换 RDD也提供数据沿袭——以图形形式给出每个中间步骤的祖先树，当RDD的一个分区丢失，可以根据祖先树重建该分区。 RDD有两组操作，转换(transformation)和行动(actio ...

分类：其他好文时间：2020-07-28 22:37:30 阅读次数：72

Hadoop HA高可用搭建流程

一、HDFS-HA集群配置 1.环境准备 1. 修改IP 2. 修改主机名及主机名和IP地址的映射 3. 关闭防火墙 4. ssh免密登录 5. 安装JDK，配置环境变量等 2.规划集群 hadoop102 hadoop103 hadoop104 NameNode NameNode JournalN ...

分类：其他好文时间：2020-07-28 22:19:09 阅读次数：77

spark中的透视函数pivot

透视函数其实就是我们excel中常用的数据透视表相似，先来看个例子。以下是准备的数据源，数据是电商系统中用户的行为数据(浏览，收藏，加购，成交，评分等)，score为统计次数。对应的字段分别为租户id，用户id，商品编码Id，行为事件代码，当日统计次数，统计日期。现在我们要转换成目标的数据是 ...

分类：其他好文时间：2020-07-28 17:17:13 阅读次数：131

共26003条上一页 1 ... 52 53 54 55 56 ... 2601 下一页

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)