搜索关键字：scala bigdata 大數據 spark，搜索到10680个结果！码迷,mamicode.com！

《快学Scala》第八章——继承

一.本章要点 extends，final关键字和Java一样重写方法时必须使用override 只有主构造器可以调用超类的构造器可以重写字段二.扩展类 Scala扩展类和Java一样(使用extends关键字)，也可以将类声明为final让它不能被扩展，也可以将单个方法或字段声明为final， ...

分类：其他好文时间：2019-11-28 21:34:11 阅读次数：96

【Flink】Flink基础之WordCount实例（Java与Scala版本）

简述 WordCount（单词计数）作为大数据体系的标准示例，一直是入门的经典案例，下面用java和scala实现Flink的WordCount代码；采用IDEA + Maven + Flink 环境；文末附 pom 文件和相关技术点总结； Java批处理版本运行输出结果如下： Java流处理版 ...

分类：编程语言时间：2019-11-28 19:14:57 阅读次数：101

不要把分层当做解耦！

公司的老员工很喜欢一种他们称之为“解耦”的做法：先这么进行系统分析：把系统运行拆解为若干个环节，先执行A，再执行B，形成一个一个的步骤。然后进行“解耦”：把每个环节变成一个服务，环节之间用 MQ 连接。环节衔接的输入输出数据形成协议规范。 “解耦”之后得到的好处是：环节用MQ串联，当服务死掉后 ...

分类：其他好文时间：2019-11-28 13:33:23 阅读次数：81

在 json4s 中自定义CustomSerializer

到目前为止，Scala 环境下至少存在6种 Json 解析的类库，这里面不包括 Java 语言实现的 Json 类库。所有这些库都有一个非常相似的抽象语法树(AST)。而 json4s 项目旨在提供一个单一的 AST 树供其他 Scala 类库来使用。 json4s 的使用非常的简单，它可以将类直接 ...

分类：Web程序时间：2019-11-27 23:24:50 阅读次数：115

大数据从入门到项目实战，精品学习材料，值得大家一看

01-大数据快速入门基础02-Scala学习进击大数据Spark生态圏03-Spark从入门到项目实战大师课04-大数据系统学习全套视频教程(视频.源码.课件)05-大数据系统学习项目实战就业班课程06-大数据之Spark零基础到实战07-大数据项目实战视频hadoop spark实时计算项目实战教 ...

分类：其他好文时间：2019-11-27 23:18:45 阅读次数：126

Spark闭包与序列化

Spark的官方文档再三强调那些将要作用到RDD上的操作，不管它们是一个函数还是一段代码片段，它们都是“闭包”，Spark会把这个闭包分发到各个worker节点上去执行，这里涉及到了一个容易被忽视的问题：闭包的“序列化”。显然，闭包是有状态的，这主要是指它牵涉到的那些自由变量以及自由变量依赖到的其 ...

分类：其他好文时间：2019-11-27 23:17:08 阅读次数：105

《快学Scala》第四章——映射和数组

一.本章要点 Scala有十分易用的语言来创建，查询和遍历映射你需要从可变和不可变的映射中做出选择默认情况下，你得到的是一个哈希映射，不过你也可以指明要树形映射你可以很容易地在Scala映射和Java映射之间来回切换元祖可以用来聚集值二.构造映射（哈希表）构造不可变映射： val sco ...

分类：编程语言时间：2019-11-27 17:35:02 阅读次数：104

scala中var和val的区别

scala中的var和val都是变量，两者有什么区别？下面通过代码来看一下吧！ object variable { //var和val的区别 //结论：var可以被赋值多次，而val只能被赋值一次 def main(args: Array[String]): Unit = { var a = 1 ...

分类：其他好文时间：2019-11-26 19:58:50 阅读次数：146

scala中break和java中的break有什么不同

scala中的break和java中的break作用是一样的，都是跳出循环，只两者的用法不太一样。 1.scala中break中的用法import scala.util.control.Breaks import scala.util.control.Breaksobject breakDemo { ...

分类：编程语言时间：2019-11-26 19:26:08 阅读次数：95

Spark相关知识

基本概念： Spark作为新一代大数据计算引擎，因为内存计算的特性，具有比hadoop更快的计算速度。是一个分布式计算框架，旨在简化运行于计算机集群上的并行程序的编写。RDD：是spark核心数据处理模型，弹性分布式数据集(Resilient Distributed Dataset)是分布式内存的一 ...

分类：其他好文时间：2019-11-26 16:12:00 阅读次数：95

共10680条上一页 1 ... 122 123 124 125 126 ... 1068 下一页

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)