搜索关键字：spark history，搜索到9960个结果！码迷,mamicode.com！

Spark on Kubernetes与阿里云的深度整合

将Spark on Kubernetes与阿里云深度整合，设计一个开箱即用的Spark on Kubernetes镜像。 ...

分类：Web程序时间：2020-02-22 13:53:07 阅读次数：74

Spark RDD基本概念、宽窄依赖、转换行为操作

本文介绍一下rdd的基本属性概念、rdd的转换/行动操作、rdd的宽/窄依赖。 ...

分类：其他好文时间：2020-02-22 13:40:00 阅读次数：67

1. Spark 概念

Apache Spark: http://spark.apache.org/ ...

分类：其他好文时间：2020-02-22 12:08:37 阅读次数：48

spark集群

https://blog.csdn.net/boling_cavalry/article/details/86747258 https://www.cnblogs.com/xuliangxing/p/7234014.html 第二个链接较为详细，但版本较旧注意spark 7077端口URL，如果h ...

分类：其他好文时间：2020-02-22 09:20:09 阅读次数：75

小记--------spark ——AGScheduler源码分析

DAGScheduler类位置：org.apache.spark.scheduler //DAGScheduler调度的核心入口 1 private[scheduler] def handleJobSubmitted(jobId: Int, 2 finalRDD: RDD[_], 3 func: ( ...

分类：其他好文时间：2020-02-22 00:19:46 阅读次数：64

HDFS架构

学习一个新框架方法：推荐：官网+源码跪在坚持 hadoop.apache.org spark.apache.org flink.apache.org storm.apache.org Hadoop:由HDFS/YARN/Map Reduce构成 HDFS 一个NameNode 和多个DATa N ...

分类：其他好文时间：2020-02-21 18:19:23 阅读次数：55

大数据引擎分代

大致可以将大数据的计算引擎分成了 4 代。 1、第一代的计算引擎，无疑就是Hadoop承载的MapReduce。它将每个JobApp都被设计为两个阶段，分别为Map和Reduce。对于上层应用来说，就不得不想方设法去拆分算法，甚至于不得不在上层应用实现多个App的串联，才能完成一个完整的算法，例 ...

分类：其他好文时间：2020-02-21 12:50:43 阅读次数：77

(数据挖掘)大数据Flume+kafka+zookeeper+Strom/Spark/Fink......

图中黑点代表求婚注册者.假如是一个程序员 ...

分类：Web程序时间：2020-02-21 09:55:14 阅读次数：71

RDD（一）——概述

什么是RDD RDD（Resilient Distributed Dataset）叫做弹性分布式数据集，是Spark中最基本的数据抽象（其实是计算抽象）。代码中是一个抽象类，它代表一个不可变、可分区、里面的元素可并行计算的集合。不可变：数据一旦写入，不可更改；联想到java 中的String类型， ...

分类：其他好文时间：2020-02-20 21:55:51 阅读次数：104

Spark之RDD本质

1、在一个完整的数据转换流程里往往涉及到多个具有衍生关系RDD，这些RDD其实是通过逻辑串联来利用装饰器模式层层包装扩展的的一堆对象，这些相邻RDD间必须有继承关系。并且比Java中的装饰器来的更彻底，借助Scala的抽象控制特性，这一系列RDD不代表任何实际数据，也不负责装载数据，描述的是纯粹的逻 ...

分类：其他好文时间：2020-02-20 20:30:35 阅读次数：69

共9960条上一页 1 ... 75 76 77 78 79 ... 996 下一页

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)