搜索关键字：算子，搜索到933个结果！码迷,mamicode.com！

spark中的持久化(cache()、persist()、checkpoint())

分类：系统相关时间：2021-04-06 14:53:55 阅读次数：0

Spark性能调优-RDD算子调优篇（深度好文，面试常问，建议收藏）

RDD算子调优不废话，直接进入正题！ 1. RDD复用在对RDD进行算子时，要避免相同的算子和计算逻辑之下对RDD进行重复的计算，如下图所示：对上图中的RDD计算架构进行修改，得到如下图所示的优化结果： 2. 尽早filter 获取到初始RDD后，应该考虑尽早地过滤掉不需要的数据，进而减少对内 ...

分类：其他好文时间：2021-03-06 14:22:58 阅读次数：0

Halcon 算子 gen_cross_contour_xld，生成十字形

函数原型： gen_cross_contour_xld( : Cross : Row, Col, Size, Angle :) 函数作用：为输入的每一个点生成十字形参数列表：Cross（out）：生成XLD轮廓 Row（in）：输入点集行坐标 Col（in）：输入点集列坐标，Col元组的个数与R ...

分类：其他好文时间：2021-02-26 12:58:40 阅读次数：0

Spark07-SparkSQL

在介绍 Spark SQL之前，我们先了解两种基本的数据分析方式。一、数据分析的两种方式数据分析的方式大致上可以划分为 SQL 和命令式两种。命令式在前面的 RDD部分,非常明显可以感觉的到是命令式的,主要特征是通过一个算子,可以得到一个结果,通过结果再进行后续计算。例如： sc.para ...

分类：数据库时间：2021-02-16 12:29:50 阅读次数：0

CSP算法题基础（1）

CSP算法题基础 C++程序里面会添加许多头文件，头文件的格式一般是 1763#include<头文件名> 我们先接触这两个头文件cstdio和iostream，其中cstdio包含了两个函数printf输出函数和scanf输入函数；第二个头文件是iostream,主要包含了cin,cout,end ...

分类：编程语言时间：2021-02-01 12:55:52 阅读次数：0

Flink可靠性的基石-checkpoint机制详细解析

Checkpoint介绍 checkpoint机制是Flink可靠性的基石，可以保证Flink集群在某个算子因为某些原因(如异常退出)出现故障时，能够将整个应用流图的状态恢复到故障之前的某一状态，保证应用流图状态的一致性。Flink的checkpoint机制原理来自“Chandy-Lamport ...

分类：其他好文时间：2021-01-28 12:03:40 阅读次数：0

spark-------------RDD 转换算子-----value类型(一)

引言 RDD 根据数据处理方式的不同将算子整体上分为 Value 类型、双 Value 类型和 Key-Value类型，本文主要讲一些Value 类型正文资源路径和资源内容 map ###函数签名:def map[U: ClassTag](f: T ? U): RDD[U] ###函数说明:将处 ...

分类：其他好文时间：2021-01-27 12:50:51 阅读次数：0

Spark应用程序执行-阶段的划分

阶段的划分 ? SparkContext对象包含有一个私有属性DAGScheduler阶段调度器，主要用于阶段的划分。在一个应用程序中，任务的提交都是从行动算子触发的。行动算子的方法内部会调用一个runJob方法，其中就有DAG调度器发挥运行Job的作用： dagScheduler.runJob(r ...

分类：其他好文时间：2021-01-08 11:26:05 阅读次数：0

基本状态转移算法激起MATLAB实现

状态转移算法是由周晓君博士等[4]于2012年正式提出的一种新颖的智能型随机性全局优化方法,它的基本思想是将最优化问题的一个解看成是一个状态, 解的迭代更新过程看成是状态转移过程, 利用现代控制理论的状态空间表达式来作为产生候选解的统一框架, 基于此框架来设计状态变换算子. 与大多数基于种群的进化算 ...

分类：编程语言时间：2020-12-22 11:58:24 阅读次数：0

图解Spark系列：RDD的创建与执行

设计Spark程式过程中最初始的是创建RDD数据集，该数据集来自定义的源数据，当RDD数据集初始后，再通过算子对RDD数据集作转换生成后续的数据集。Spark中提供了多种创建RDD数据集的方法，比如：通过内存集合创建、或使用本地文件创建以及HDFS文件创建RDD数据集。最常见的是第三种方式，生产环境下通常会读取并基于HDFS上存储的数据来创建并进行离线批处理。典型的RDD创建流程为，通过输入算子（

分类：其他好文时间：2020-12-04 10:59:58 阅读次数：4

共933条上一页 1 2 3 4 ... 94 下一页

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)