命令式: 面向过程: C语言、COBOL、Fortran, 面向对象: C++、Java、PHP、python、go、Objective C、C ,swift,ruby,groovy,D, 声明式: SQL 函数式: Haskell、F 、ML、Scala、lisp、logo、Scheme、R,MA ...
分类:
编程语言 时间:
2019-11-24 17:18:02
阅读次数:
82
面向对象:Java、C++、python、C 、VB、JavaScript、PHP、Ruby、objective—C、Delphi Groovy、R、VB.net、D、MATLAB、Go、Perl、SAS、dart、rust、scratch、 Fortran、Scala、RPG、kotlin、ada ...
分类:
编程语言 时间:
2019-11-24 14:02:05
阅读次数:
86
命令式: python、Java等 面向过程: C语言、COBOL、Fortran,等 面向对象: C++、Java、PHP、python、go、Objective C、C ,swift,ruby,groovy,D,等 声明式 SQL, 函数式: Haskell、F 、ML、Scala、lisp、l ...
分类:
编程语言 时间:
2019-11-24 13:26:13
阅读次数:
91
Bundled Examples Flink 不同的api详细例子 DataStream applications ( "Java" / "Scala" ) DataSet applications ( "Java" / "Scala" ) Table API / SQL queries ( "Ja ...
分类:
其他好文 时间:
2019-11-24 09:31:14
阅读次数:
73
累加器: 场景:各种计数问题,这个计算需要在driver端合并。 作用:解决Driver端和Execute端数据共享问题。 如图,需要将Driver端变量备份到Executor端,那么copy到Executor端的变量一定要是Executor级别的变量。那么如何自定义一个累加器呢,如何将累加器数据类 ...
分类:
其他好文 时间:
2019-11-23 22:10:42
阅读次数:
133
? 一,什么是RDD? 官方定义 :RDD是弹性分布式数据集。 1. 不可变的:类似于scala中的不可变集合,对集合进行转换操作的时候,产生新的集合RDD。 2. 分区的:每个RDD集合有多个分区组成,分区就是很多部分。 3. 并行操作:对RDD集合中的数据操作时,可以同时对所有的分区并行操作 五 ...
分类:
其他好文 时间:
2019-11-22 15:28:06
阅读次数:
62
1. hdfs存文件的时候会把文件切割成block,block分布在不同节点上,目前设置replicate=3,每个block会出现在3个节点上。 2. Spark以RDD概念为中心运行,RDD代表抽象数据集。以代码为例: sc.textFile(“abc.log”) textFile()函数会创建 ...
分类:
其他好文 时间:
2019-11-22 13:26:33
阅读次数:
63
1、Flume简介 ? (1) Flume提供一个分布式的,可靠的,对大数据量的日志进行高效收集、聚集、移动的服务,Flume只能在Unix环境下运行。 ? (2) Flume基于流式架构,容错性强,也很灵活简单。 ? (3) Flume、Kafka用来实时进行数据收集,Spark、Flink用来实 ...
分类:
Web程序 时间:
2019-11-22 12:11:59
阅读次数:
201
在没有安装flink的情况下,试运行 wordcount 代码。代码如下: package bigdata.batch; import org.apache.flink.api.common.functions.FlatMapFunction; import org.apache.flink.api ...
分类:
其他好文 时间:
2019-11-22 01:09:59
阅读次数:
93