线程概念 进程:启动一个应用程序就叫一个进程。 接着又启动一个应用程序,这叫两个进程。每个进程都有一个独立的内存空间;进程也是程序的一次执行过程,是系统运行程序的基本单位;系统运行一个程序即是一个进程从创建、运行到消亡的过程。 线程:线程是在进程内部同时做的事情,一个进程中可以有多个线程,这个应用程 ...
分类:
编程语言 时间:
2020-07-08 18:17:55
阅读次数:
59
Concept http://spark.apache.org/streaming/ Spark Streaming makes it easy to build scalable fault-tolerant streaming applications. Ease of Use Build ap ...
分类:
其他好文 时间:
2020-07-08 13:26:09
阅读次数:
59
repartition repartition 有三个重载的函数: 1) def repartition(numPartitions: Int): DataFrame /** * Returns a new [[DataFrame]] that has exactly `numPartitions` ...
分类:
数据库 时间:
2020-07-08 13:17:49
阅读次数:
93
一、登录功能 1.1登录所涉及的功能主要包括拦截器,过滤器,用户在未登录的时候,访问页面会阻止访问的,如图所示: 实现这个功能的主要代码如下所示 1 //拦截器 2 public class LoginHandlerInterceptor implements HandlerInterceptor ...
分类:
编程语言 时间:
2020-07-08 01:24:05
阅读次数:
86
Spark 源码解读(五)SparkContext的初始化之创建和启动DAGScheduler DAGScheduler主要用于在任务正式提交给TaskSchedulerImpl提交之前做一些准备工作,包括:创建job,将DAG中的RDD划分到不同的Stage,提交Stage等等。SparkCont ...
分类:
其他好文 时间:
2020-07-07 23:39:16
阅读次数:
102
1.分区的作用 RDD 使用分区来分布式并行处理数据, 并且要做到尽量少的在不同的 Executor 之间使用网络交换数据, 所以当使用 RDD 读取数据的时候, 会尽量的在物理上靠近数据源, 比如说在读取 Cassandra 或者 HDFS 中数据的时候, 会尽量的保持 RDD 的分区和数据源的分 ...
分类:
其他好文 时间:
2020-07-07 13:11:09
阅读次数:
164
本文已收录GitHub,更有互联网大厂面试真题,面试攻略,高效学习资料等近些年来,开源流处理领域涌现出了很多优秀框架。光是在Apache基金会孵化的项目,关于流处理的大数据框架就有十几个之多,比如早期的ApacheSamza、ApacheStorm,以及这两年火爆的Spark以及Flink等。应该说,每个框架都有自己独特的地方,也都有自己的缺陷。面对这众多的流处理框架,我们应该如何选择呢?在本文汇
分类:
其他好文 时间:
2020-07-07 11:38:26
阅读次数:
67
type 指定元素的类型。{ text、password、checkbox、radio、submit、reset、file、hidden、image 和 button,默认值为 text } name 指定表单元素的名称 value 元素的初始值。type 为 radio时必须指定一个值 size ...
分类:
其他好文 时间:
2020-07-06 21:36:08
阅读次数:
93
一、实现Runnable接口 public class RunnableDemo implements Runnable { public void run() { try { Thread.sleep(100); } catch (InterruptedException e) { e.print ...
分类:
编程语言 时间:
2020-07-06 19:33:53
阅读次数:
86
1、Spark是什么 Spark是一个高性能内存处理引擎,它提供了基于RDD的数据抽象,能够灵活处理分布式数据集 2、Spark核心概念 RDD:弹性分布式数据集,它是一个只读的、带分区的数据集合,并支持多种分布式算子。由下面5部分构成: 一组partition 每个partition的计算函数 所 ...
分类:
其他好文 时间:
2020-07-06 19:30:48
阅读次数:
57