码迷,mamicode.com
首页 >  
搜索关键字:spark executor worker    ( 10463个结果
docker 常用命令 system篇
1.查看docker 空间使用情况 [root@worker1 ~]# docker system df TYPE TOTAL ACTIVE SIZE RECLAIMABLE Images 3 0 319.9MB 319.9MB (100%) Containers 0 0 0B 0B Local V ...
分类:其他好文   时间:2020-07-07 11:37:17    阅读次数:90
回炉重造之 nginx
一 模块介绍 核心模块 user: 用来指定运行 nginx worker 进程的用户名 daemon: 是否指定以后台的方式运行,默认为on error_log: 用来定义nginx错误日志的输出位置以及格式 基本格式如下: Syntax: error_log file [level]; Defa ...
分类:其他好文   时间:2020-07-07 00:12:15    阅读次数:134
Spark
1、Spark是什么 Spark是一个高性能内存处理引擎,它提供了基于RDD的数据抽象,能够灵活处理分布式数据集 2、Spark核心概念 RDD:弹性分布式数据集,它是一个只读的、带分区的数据集合,并支持多种分布式算子。由下面5部分构成: 一组partition 每个partition的计算函数 所 ...
分类:其他好文   时间:2020-07-06 19:30:48    阅读次数:57
Spark快速入门之RDD编程模型
RDD(Resilient Distributed Dataset)叫做分布式数据集,是Spark中最基本的数据抽象,它代表一个可分区,不可变,里面的元素可并行计算的结合。RDD具有自动容错、位置感知性调度和可伸缩性。RDD允许用户在执行多个查询时显示地将工作集换存在内存中,后续的查询能够重用工作集 ...
分类:其他好文   时间:2020-07-06 16:20:23    阅读次数:61
Spark 两种方法计算分组取Top N
Spark 分组取Top N运算 大数据处理中,对数据分组后,取TopN是非常常见的运算。 下面我们以一个例子来展示spark如何进行分组取Top的运算。 1、RDD方法分组取TopN from pyspark import SparkContext sc = SparkContext() 准备数据 ...
分类:其他好文   时间:2020-07-06 16:11:05    阅读次数:78
IDEA创建Spark开发环境
下面安装的六步和通过Maven安装Java项目的方式相同 如果刚安装完IDEA,直接点击[Create New Project] 左侧选择Maven,然后先勾选上部的[Create from archetype],然后右侧选择[maven-archetype-quickstart] 填写GroupI ...
分类:其他好文   时间:2020-07-05 19:02:22    阅读次数:90
Spark DAG 依赖关系 Stage
DAG : 整个计算链可以抽象为一个DAG(有向无环图) Spark 的 DAG 作用: 记录了RDD之间的依赖关系,即RDD是通过何种变换生成的, 如下图:RDD1是RDD2的父RDD,通过flatMap操作生成 借助RDD之间的依赖关系,可以实现数据的容错, 即子分区(子RDD)数据丢失后,可以 ...
分类:其他好文   时间:2020-07-05 17:29:07    阅读次数:56
Spark RDD
RDD概述 RDD:弹性分布式数据集,初学时,可以把RDD看做是一种集合类型(和Array,List类比) RDD的特点: ①有容错性,即数据丢失是可以恢复的 ②有分区机制,可以并行的处理RDD数据 创建RDD的2种方式: ①将一个普通的集合类型(Array或List) ②通过Spark读取外部存储 ...
分类:其他好文   时间:2020-07-05 15:15:06    阅读次数:66
ThreadPoolExecutor讲解
线程池是为了避免线程频繁的创建和销毁带来的性能消耗,而建立的一种池化技术,它是把已创建的线程放入“池”中,当有任务来临时就可以重用已有的线程,无需等待创建的过程,这样就可以有效提高程序的响应速度。但如果要说线程池的话一定离不开 ThreadPoolExecutor。线程池不允许使用 Executor ...
分类:其他好文   时间:2020-07-04 22:23:53    阅读次数:65
JStorm介绍
一、简介JStorm是一个分布式实时计算引擎。JStorm是一个类似于Hadoop MapReduce的系统,用户按照指定的接口实现一个任务,然后将这个任务交给JStorm系统,JStorm将这个任务跑起来,并按7*24小时运行。如果中间一个worker发生了意外故障,调度器立即分配一个新的work ...
分类:Web程序   时间:2020-07-04 20:35:29    阅读次数:54
10463条   上一页 1 ... 36 37 38 39 40 ... 1047 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!