码迷,mamicode.com
首页 >  
搜索关键字:spark 安装、介绍    ( 7164个结果
Spark简介
详细内容参照Spark官网:http://spark.apache.org/ Spark相关项目: Spark SQL 、Spark Streaming 、Machine Learning 、GraphX 1、Spark SQL :用Spark编写的混合SQL查询,能在分布式数据集中查询结构化数据,使得复杂分析算法的查询更容易。 2、Spark Streaming :Spark Strea...
分类:其他好文   时间:2015-07-14 11:35:22    阅读次数:257
DT大数据梦工厂 第51讲
王家林亲授《DT大数据梦工厂》大数据实战视频“Scala深入浅出实战经典”视频、音频和PPT下载!第51讲:Scala中链式调用风格的实现代码实战及其在Spark编程中的广泛运用百度云:http://pan.baidu.com/s/1eQGqzEa360云盘:http://yunpan.cn/cc....
分类:其他好文   时间:2015-07-13 21:56:51    阅读次数:104
【Spark】概述
大数据数据处理模型:1.Google的MapReduce是一个简单通用和自动容错的批处理计算模型。但,不适合交互式和流式计算!2.Storm3.Impala4.GraphLab5.SparkSpark: 伯克利大学提出, RDD概念(一种新的抽象的弹性数据集),MapReduce的一种扩展。RDD本...
分类:其他好文   时间:2015-07-13 13:50:04    阅读次数:103
spark aggregate
该函数官方的api,说的不是很明白:aggregate(zeroValue, seqOp, combOp)Aggregate the elements of each partition, and then the results for all the partitions, using a gi...
分类:其他好文   时间:2015-07-13 13:42:45    阅读次数:155
Spark Streaming教程
废话不说,先来个示例,有个感性认识再介绍。这个示例来自spark自带的example,基本步骤如下:(1)使用以下命令输入流消息:$ nc -lk 9999(2)在一个新的终端中运行NetworkWordCount,统计上面的词语数量并输出:$ bin/run-example streaming.N...
分类:其他好文   时间:2015-07-13 13:42:31    阅读次数:2037
Introduction to Big Data with Apache Spark 课程总结
课程主要实用内容:1.spark实验环境的搭建2.4个lab的内容3.常用函数4.变量共享1.spark实验环境的搭建(windows)a. 下载,安装visualbox 管理员身份运行;课程要求最新版4.3.28,如果c中遇到虚拟机打不开的,可以用4.2.12,不影响b. 下载,安装vagrant...
分类:Web程序   时间:2015-07-13 13:39:20    阅读次数:169
浅析 hadoop与spark
Apache Hadoop和Apache Spark 接下来谈多核机器、 PB级数据和任务,这跟所有从twitter提到的Java或重载机器学习算法类似。谈到Hadoop,不得不说这个应用广泛的框架及它的组 件:Hadoop分布式文件系统(HDFS)、资源管...
分类:其他好文   时间:2015-07-13 12:29:55    阅读次数:141
Apache Spark 1.4 读取 hadoop 2.6 文件系统上文件
scala> val file = sc.textFile("hdfs://9.125.73.217:9000/user/hadoop/logs") scala> val count = file.flatMap(line => line.split(" ")).map(word => (word,...
分类:Web程序   时间:2015-07-12 23:08:03    阅读次数:274
JavaScript 中值得注意的要点(1)
Delete 操作在数组与对象之间的差异 对数组进行 delete 运算,效果与对对象进行 delete 运算不同;见下: //delete操作在对象和数组之间的不同 //先删除对象的属性 var originObj={name:'Spark',inner:{top:'shirt',short:'T...
分类:编程语言   时间:2015-07-12 17:17:49    阅读次数:144
【Spark】RDD操作详解4——Action算子
本质上在Actions算子中通过SparkContext执行提交作业的runJob操作,触发了RDD DAG的执行。 根据Action算子的输出空间将Action算子进行分类:无输出、 HDFS、 Scala集合和数据类型。无输出foreach对RDD中的每个元素都应用f函数操作,不返回RDD和Array,而是返回Uint。 图中,foreach算子通过用户自定义函数对每个数据项进行操作。...
分类:其他好文   时间:2015-07-12 11:10:23    阅读次数:199
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!