码迷,mamicode.com
首页 >  
搜索关键字:scala bigdata 大數據 spark    ( 10680个结果
《快学Scala》第八章——继承
一.本章要点 extends,final关键字和Java一样 重写方法时必须使用override 只有主构造器可以调用超类的构造器 可以重写字段 二.扩展类 Scala扩展类和Java一样(使用extends关键字),也可以将类声明为final让它不能被扩展,也可以将单个方法或字段声明为final, ...
分类:其他好文   时间:2019-11-28 21:34:11    阅读次数:96
【Flink】Flink基础之WordCount实例(Java与Scala版本)
简述 WordCount(单词计数)作为大数据体系的标准示例,一直是入门的经典案例,下面用java和scala实现Flink的WordCount代码; 采用IDEA + Maven + Flink 环境;文末附 pom 文件和相关技术点总结; Java批处理版本 运行输出结果如下: Java流处理版 ...
分类:编程语言   时间:2019-11-28 19:14:57    阅读次数:101
不要把分层当做解耦!
公司的老员工很喜欢一种他们称之为“解耦”的做法: 先这么进行系统分析:把系统运行拆解为若干个环节,先执行A,再执行B,形成一个一个的步骤。 然后进行“解耦”:把每个环节变成一个服务,环节之间用 MQ 连接。环节衔接的输入输出数据形成协议规范。 “解耦”之后得到的好处是: 环节用MQ串联,当服务死掉后 ...
分类:其他好文   时间:2019-11-28 13:33:23    阅读次数:81
在 json4s 中自定义CustomSerializer
到目前为止,Scala 环境下至少存在6种 Json 解析的类库,这里面不包括 Java 语言实现的 Json 类库。所有这些库都有一个非常相似的抽象语法树(AST)。而 json4s 项目旨在提供一个单一的 AST 树供其他 Scala 类库来使用。 json4s 的使用非常的简单,它可以将类直接 ...
分类:Web程序   时间:2019-11-27 23:24:50    阅读次数:115
大数据从入门到项目实战,精品学习材料,值得大家一看
01-大数据快速入门基础02-Scala学习进击大数据Spark生态圏03-Spark从入门到项目实战大师课04-大数据系统学习全套视频教程(视频.源码.课件)05-大数据系统学习项目实战就业班课程06-大数据之Spark零基础到实战07-大数据项目实战视频hadoop spark实时计算项目实战教 ...
分类:其他好文   时间:2019-11-27 23:18:45    阅读次数:126
Spark闭包与序列化
Spark的官方文档再三强调那些将要作用到RDD上的操作,不管它们是一个函数还是一段代码片段,它们都是“闭包”,Spark会把这个闭包分发到各个worker节点上去执行,这里涉及到了一个容易被忽视的问题:闭包的“序列化”。 显然,闭包是有状态的,这主要是指它牵涉到的那些自由变量以及自由变量依赖到的其 ...
分类:其他好文   时间:2019-11-27 23:17:08    阅读次数:105
《快学Scala》第四章——映射和数组
一.本章要点 Scala有十分易用的语言来创建,查询和遍历映射 你需要从可变和不可变的映射中做出选择 默认情况下,你得到的是一个哈希映射,不过你也可以指明要树形映射 你可以很容易地在Scala映射和Java映射之间来回切换 元祖可以用来聚集值 二.构造映射(哈希表) 构造不可变映射: val sco ...
分类:编程语言   时间:2019-11-27 17:35:02    阅读次数:104
scala中var和val的区别
scala中的var和val都是变量,两者有什么区别? 下面通过代码来看一下吧! object variable { //var和val的区别 //结论:var可以被赋值多次,而val只能被赋值一次 def main(args: Array[String]): Unit = { var a = 1 ...
分类:其他好文   时间:2019-11-26 19:58:50    阅读次数:146
scala中break和java中的break有什么不同
scala中的break和java中的break作用是一样的,都是跳出循环,只两者的用法不太一样。 1.scala中break中的用法import scala.util.control.Breaks import scala.util.control.Breaksobject breakDemo { ...
分类:编程语言   时间:2019-11-26 19:26:08    阅读次数:95
Spark相关知识
基本概念: Spark作为新一代大数据计算引擎,因为内存计算的特性,具有比hadoop更快的计算速度。是一个分布式计算框架,旨在简化运行于计算机集群上的并行程序的编写。RDD:是spark核心数据处理模型,弹性分布式数据集(Resilient Distributed Dataset)是分布式内存的一 ...
分类:其他好文   时间:2019-11-26 16:12:00    阅读次数:95
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!