搜索关键字：scala bigdata 大數據 spark，搜索到10680个结果！码迷,mamicode.com！

spark之从外部文件获取广播变量

public static Map<String,String> loadDataFromFile() { Map<String,String> map = new ConcurrentHashMap<>(); try { File file = new File("filename.txt"); ...

分类：其他好文时间：2020-05-12 11:45:24 阅读次数：82

Spark的Job的划分

Job的划分 1、Application : 应用，创建一个SparkContext可以认为创建了一个Application 2、Job 在一个app中每执行一次行动算子就会创建一个Job,一个application会有多个job 3、stage 阶段，每碰到一个shuffle算子，会产生一个新的 ...

分类：其他好文时间：2020-05-11 23:56:54 阅读次数：213

Flink学习（三）批流版本的wordcount JAVA版本

Flink 开发环境通常来讲，任何一门大数据框架在实际生产环境中都是以集群的形式运行，而我们调试代码大多数会在本地搭建一个模板工程，Flink 也不例外。 Flink 一个以 Java 及 Scala 作为开发语言的开源大数据项目，通常我们推荐使用 Java 来作为开发语言，Maven 作为编译和包 ...

分类：编程语言时间：2020-05-11 23:48:25 阅读次数：101

Flink学习（三）批流版本的wordcount Scala版本

批处理代码： package com.wyh.wc import org.apache.flink.api.scala._ /** * 批处理代码 */ object WordCount { def main(args: Array[String]): Unit = { //创建一个批处理的一个环境 ...

分类：其他好文时间：2020-05-11 23:28:06 阅读次数：79

Spark性能优化指南——高级篇

Spark性能优化指南——高级篇 2016年05月12日作者: 李雪蕤文章链接 23095字 47分钟阅读继基础篇讲解了每个Spark开发人员都必须熟知的开发调优与资源调优之后，本文作为《Spark性能优化指南》的高级篇，将深入分析数据倾斜调优与shuffle调优，以解决更加棘手的性能问题。 ...

分类：其他好文时间：2020-05-11 23:20:20 阅读次数：91

Spark内核源码继续五：Master原理解析和源码解析

上篇已经降到AppClient找Master进行注册，本章主要解析Master的原理和源码解析 1、Master的主备切换原理 package org.apache.spark.deploy.master completeRecovery，过滤没有响应的worker，app，drivers，从内存缓 ...

分类：其他好文时间：2020-05-11 15:54:04 阅读次数：62

【译】Using .NET for Apache Spark to Analyze Log Data

.NET for Spark可用于处理成批数据、实时流、机器学习和ad-hoc查询。在这篇博客文章中，我们将探讨如何使用.NET for Spark执行一个非常流行的大数据任务，即日志分析。 1 什么是日志分析？日志分析的目标是从这些日志中获得有关工具或服务的活动和性能的有意义的见解。NET fo ...

分类：Web程序时间：2020-05-11 09:13:31 阅读次数：92

scala 中 Any、AnyRef、Object、AnyVal 关系

Any，是 scala 中的抽象类，不能实例化 AnyRef 继承于 Any，它是一个 trait AnyVal 继承于 Any，它是一个抽象类，目的是消除基本类型，scala中只有引用类型，仅此作用 Any、Object 定义上没有任何关系 AnyRef、Object 定义上没有任何关系 scal ...

分类：其他好文时间：2020-05-11 01:26:41 阅读次数：206

《Spark大数据处理：技术、应用与性能优化》

链接：https://pan.baidu.com/s/1nGkLfRy9izODONbMbLO8rA 提取码：rjpn ...

分类：其他好文时间：2020-05-10 23:13:35 阅读次数：61

Spark内核源码解析四：SparkContext原理解析和源码解析

源码解析主构造函数代码 private[spark] var (schedulerBackend, taskScheduler) = SparkContext.createTaskScheduler(this, master) createTaskScheduler，创建TaskScheduler ...

分类：其他好文时间：2020-05-10 23:08:55 阅读次数：63

共10680条上一页 1 ... 51 52 53 54 55 ... 1068 下一页

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)