码迷,mamicode.com
首页 >  
搜索关键字:spark rdd    ( 7287个结果
Spark安装
记录安装Spark环境的过程。前提是Hadoop集群已经安装,详见:Hadoop 2.X 集群安装环境:Centos 6.4 X64 & Hadoop 2.2(三节点集群) & Spark 1.01、获取Spark源码,可以去官网下载,解压。2、编译源码。1)先安装Maven。2)进入源码目录,执行...
分类:其他好文   时间:2014-07-16 19:28:29    阅读次数:180
ZOJ3379 Master Spark
(¦3[____]← 扫描线问题,抛物线方程为 y=a*x*x 形式,对每个点求出抛物线中轴的范围theta-delta~theta+delta,theta = atan2(y,x),delta则用方程组可解x*x+y*y=z*z+(a*z*z)^2,tan(theta)=z/(a*z*z),故th...
分类:其他好文   时间:2014-07-16 19:21:57    阅读次数:191
spark热点互动问答
[Spark亚太研究院 决战云计算大数据时代 100期公益大讲堂 互动问答]Q1:我想问,hdfs的namenode挂了,怎么处理? 使用ZooKeeper; 使用Mesos; 使用Yarn;Q2:用python和scala区别大吗? 就代码的风格而言是不大的; 世界上也有很多人使用python开发...
分类:其他好文   时间:2014-07-16 19:09:29    阅读次数:294
Spark 1.0.0 部署Hadoop 2.2.0上
源码编译我的测试环境:系统:Centos 6.4 - 64位Java:1.7.45Scala:2.10.4Hadoop:2.2.0Spark 1.0.0源码地址:http://d3kbcqa49mib13.cloudfront.net/spark-1.0.0.tgz解压源码,在根去根目录下执行以下命...
分类:其他好文   时间:2014-07-16 18:01:44    阅读次数:405
Scala环境搭建之eclipse
因为Spark的缘故,我们来看看另外一门语言——Scala,为什么要看这门语言呢?唉~其实你不看也没关系,只不过spark的内核就是用Scala写的,spark也提供其他语言的编程模型....看自己爱好啦~ 1、下载 地址:http://www.scala-lang.org/download/2.11.1.html  下载安装即可,这没什么好说的,如果不会,那我建议你也不要做开发了,回家...
分类:系统相关   时间:2014-07-16 17:36:24    阅读次数:263
整理对Spark SQL的理解
Catalyst定位 其他系统如果想基于Spark做一些类sql、标准sql甚至其他查询语言的查询,需要基于Catalyst提供的解析器、执行计划树结构、逻辑执行计划的处理规则体系等类体系来实现执行计划的解析、生成、优化、映射工作。 对应上图中,主要是左侧的TreeNodelib及中间三次转化过程中涉及到的类结构都是Catalyst提供的。至于右侧物理执行计划映射生成过程,物理执行计划基于成本的优化模型,具体物理算子的执行都由系统自己实现。 Catalyst现状 在解析器方面提供的是一个简单的scala...
分类:数据库   时间:2014-07-16 17:34:38    阅读次数:391
Spark 个人实战系列(1)--Spark 集群安装
前言: CDH4不带yarn和spark, 因此需要自己搭建spark集群. 这边简单描述spark集群的安装过程, 并讲述spark的standalone模式, 以及对相关的脚本进行简单的分析.spark官网: http://spark.apache.org/downloads.html*)安装....
分类:其他好文   时间:2014-07-16 16:56:22    阅读次数:235
高效搭建Spark完全分布式集群
本文详细总结Spark分布式集群的安装步骤,帮助想要学习Spark的技术爱好者快速搭建Spark的学习研究环境。...
分类:其他好文   时间:2014-07-14 17:17:25    阅读次数:289
十分钟了解分布式计算:Google Dataflow
Google声称内部已经抛弃Map-reduce几年了,并在今年的Google IO大会高调发布Cloud Dataflow系统。本文介绍了在这个新框架下如何进行分布式计算,并与现有基于Hadoop的Twitter Summingbird以及Spark框架进行了对比。
分类:其他好文   时间:2014-07-13 20:29:26    阅读次数:353
蔡先生论道大数据之九: 要的就是"快"
前面几章节谈论了企业如何利用大数据帮助企业建立精准营销模型,大家了解了"大数据"\"小数据",那么数据本身的问题解决了,今天我说一下另外一个非常重要的概念,就是"即时性"。可以说大数据最重要的意义之一是解决了营销上的“实时性”问题,在当下手机、平板多屏运作,快速处理用..
分类:其他好文   时间:2014-07-13 15:18:57    阅读次数:183
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!