搜索关键字：openfire spark，搜索到7382个结果！码迷,mamicode.com！

第2天Python实战Spark大数据分析及调度-RDD编程

Spark提供的主要抽象是resilient distributed dataset（RDD）弹性分布式数据集，它是跨集群节点划分的元素的集合，可以并行操作。通过从Hadoop文件系统（或任何其他Hadoop支持的文件系统）中的文件或驱动程序中现有的Scala集合开始并进行转换来创建RDD。用户还 ...

分类：编程语言时间：2020-05-31 16:03:22 阅读次数：92

Apache Spark

Apache Spark Apache Spark是一个开源集群运算框架，最初是由加州大学柏克莱分校AMPLab所开发。相对于Hadoop的MapReduce会在运行完工作后将中介数据存放到磁盘中，Spark使用了存储器内运算技术，能在数据尚未写入硬盘时即在存储器内分析运算。Spark在存储器内运行 ...

分类：Web程序时间：2020-05-31 00:41:36 阅读次数：95

Spark之RDD编程

Spark对数据的核心抽象——弹性分布式数据集（Resilient Distributed Dataset），简称RDD。RDD其实就是分布式的元素集合。在Spark中，对数据的所有操作不外乎创建RDD、转化已有RDD以及调用RDD操作进行求值。而在这背后，Spark会自动将RDD中的数据分发到集群 ...

分类：其他好文时间：2020-05-30 22:18:13 阅读次数：105

spark基础入门

第1章 Spark 概述 1.1 什么是 Spark 官网：http://spark.apache.org Spark 的产生背景 Spark 是一种快速、通用、可扩展的大数据分析引擎，2009 年诞生于加州大学伯克利分校 AMPLab，2010 年开源，2013 年 6 月成为 Apache 孵化 ...

分类：其他好文时间：2020-05-30 22:09:09 阅读次数：75

Spark Structured Streaming

###概述 Structured Streaming 是 Spark 2.0 引入的功能，有以下特点基于 Spark SQL engine 可以直接使用 DataSet/DataFrame API，就像处理离线的批数据一样 Spark SQL engine 持续地、增量地处理流数据支持 stre ...

分类：其他好文时间：2020-05-29 21:22:01 阅读次数：77

Spark分区

一、Spark数据分区方式简要在Spark中，RDD（Resilient Distributed Dataset）是其最基本的抽象数据集，其中每个RDD是由若干个Partition组成。在Job运行期间，参与运算的Partition数据分布在多台机器的内存当中。这里可将RDD看成一个非常大的数组， ...

分类：其他好文时间：2020-05-29 20:55:31 阅读次数：55

spark企业运用

Spark SQL 1、Spark SQL 是 Spark 的一个模块，可以和 RDD 进行混合编程、支持标准的数据源、可以集成和替代 Hive、可以提供 JDBC、ODBC 服务器功能。 2、Spark SQL 的特点：（1）和 Spark Core 的无缝集成，可以在写整个 RDD 应用的时候 ...

分类：其他好文时间：2020-05-29 19:38:34 阅读次数：75

Spark Streaming企业运用

Spark Streaming 是什么 1、SPark Streaming 是 Spark 中一个组件，基于 Spark Core 进行构建，用于对流式进行处理，类似于 Storm。2、Spark Streaming 能够和 Spark Core、Spark SQL 来进行混合编程。3、Spark ...

分类：其他好文时间：2020-05-29 19:33:56 阅读次数：53

spark源码解析总结

Spark 通信架构 1、spark 一开始使用 akka 作为网络通信框架，spark 2.X 版本以后完全抛弃 akka，而使用 netty 作为新的网络通信框架。最主要原因：spark 对 akka 没有维护，需要 akka 更新，spark 的发展受到了 akka 的牵制，akka 版本之间 ...

分类：其他好文时间：2020-05-29 19:20:02 阅读次数：70

Spark GraphX企业运用

Spark GraphX 概述 1、Spark GraphX是什么？（1）Spark GraphX 是 Spark 的一个模块，主要用于进行以图为核心的计算还有分布式图的计算。（2）GraphX 他的底层计算也是 RDD 计算，它和 RDD 共用一种存储形态，在展示形态上可以以数据集来表示，也可 ...

分类：其他好文时间：2020-05-29 19:11:36 阅读次数：58

共7382条上一页 1 ... 29 30 31 32 33 ... 739 下一页

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)