搜索关键字：spark 大数据 hadoop yarn，搜索到30860个结果！码迷,mamicode.com！

大数据组件

Atlas 作用：记录并展示Hive表字段含义，以及表和字段之间的数据血缘关系。局限：依赖HBase和solr。 Azkaban 作用：实现任务流执行，满足任务间依赖关系。局限：任务能添加依赖的任务，但是不能传参数，任务流中任意一条路线断了，不能这条路线重启执行。 ...

分类：其他好文时间：2021-01-07 12:23:38 阅读次数：0

Impala和Hive的关系

1.为什么安装Impala一定要先安装Hive？ Impala是基于Hive的大数据实时分析查询引擎，直接使用Hive的元数据库Metadata,意味着impala元数据都存储在Hive的metastore中。 2.Impala与Hive的关系？ Impala 与Hive都是构建在Hadoop之上的 ...

分类：其他好文时间：2021-01-06 11:58:32 阅读次数：0

Spark UDAF实现举例 -- average pooling

1.UDAF定义 spark中的UDF(UserDefinedFunction)大家都不会陌生, UDF其实就是将一个普通的函数, 包装为可以按行操作DataFrame中指定Columns的函数. 例如, 对某一列的所有元素进行+1操作, 它对应mapreduce操作中的map操作. 这种操作有 ...

分类：其他好文时间：2021-01-04 11:31:11 阅读次数：0

Hadoop-3.1.3安装

0.创建用户并付权限 sudo useradd iwbdsudo passwd iwbd 配置iwbd用户具有root权限修改/etc/sudoers文件，找到下面一行（91行），在root下面添加一行，如下所示：## Allow root to run any commands anywhere ...

分类：其他好文时间：2021-01-04 11:30:50 阅读次数：0

第四周学习总结

所学时间（包括上课） 9个小时代码量（行） 1300 博客量 1篇了解到的知识点 centos虚拟机的安装以及大数据相应所用的软件安装以及环境的配置 ...

分类：其他好文时间：2021-01-02 11:40:57 阅读次数：0

Spark 取前几行,先sort再limit

scala> val df = sc.parallelize(Seq( | (0,"cat26",30.9), | (1,"cat67",28.5), | (2,"cat56",39.6), | (3,"cat8",35.6))).toDF("Hour", "Category", "Value") ...

分类：其他好文时间：2021-01-02 11:32:57 阅读次数：0

Spark 创建一个简单的DataFrame示例

scala> val df = sc.parallelize(Seq( | (0,"cat26",30.9), | (1,"cat67",28.5), | (2,"cat56",39.6), | (3,"cat8",35.6))).toDF("Hour", "Category", "Value") ...

分类：其他好文时间：2021-01-02 11:32:37 阅读次数：0

hadoop 模板虚拟机环境准备以及对模板机的克隆

#一、linux 虚拟机最小化安装模板 ###1.准备好虚拟机（安装最小化的linux模板机） 1）准备一台模板虚拟机hadoop100，虚拟机配置要求如下：注：本文Linux系统环境全部以CentOS-7.5-x86-1804为例说明模板虚拟机：内存4G，硬盘50G，安装必要环境，为安装ha ...

分类：其他好文时间：2021-01-02 11:30:35 阅读次数：0

池化的名字由何而来？

根据前面的卷积过程，我们可以达到特征提取的作用。基本上已经判断出谁是C谁是D。底下可以再进一步做一次池化。数据库连接池记得吧？把很多数据库连接放在一个池子里，想用时挑一个来用。这里做完卷积得到这么多数据，就像池子一样，对于这池子里的数据，我们可以继续做各种各样的操作，比如最大池化或平均池化。最大池化 ...

分类：其他好文时间：2021-01-02 11:29:48 阅读次数：0

Zookeeper - 1 概述&命令

Zookeeper 概述&命令 1)初识 Zookeeper 1.1)Zookeeper概念 ?Zookeeper 是 Apache Hadoop 项目下的一个子项目，是一个树形目录服务。 ?Zookeeper 翻译过来就是动物园管理员，他是用来管 Hadoop（大象）、Hive(蜜蜂)、Pig( ...

分类：其他好文时间：2021-01-02 11:29:32 阅读次数：0

共30860条上一页 1 ... 33 34 35 36 37 ... 3086 下一页

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)