码迷,mamicode.com
首页 >  
搜索关键字:spark 安装、介绍    ( 7164个结果
spark core源码分析10 Task的运行
这一节介绍具体task的运行以及最终结果的处理 看线程运行的run方法,见代码注释 override def run(): Unit = { val taskMemoryManager = new TaskMemoryManager(env.executorMemoryManager) val deserializeStartTime = System.currentTim...
分类:其他好文   时间:2015-08-31 19:38:42    阅读次数:137
最笨的方法解决 使用Snappy 压缩方式报错“java.lang.UnsatisfiedLinkError: no snappyjava in java.library.path”
之前写过一篇这个文章:http://blog.csdn.net/stark_summer/article/details/47361603,那个时候 linux环境 spark 使用snappy方式压缩任然不好用,而今天我同事hive on hadoop 使用snappy压缩方式也报这个错,此刻的我,感觉这个问题 一定要解决 我想了想,只能使用最笨的方式先解决这个问题了,将libsnappyja...
分类:移动开发   时间:2015-08-31 17:20:25    阅读次数:467
spark架构实战
当下,Spark已经在国内得到了广泛的认可和支持:2014年,Spark Summit China在北京召开,场面火爆;同年,Spark Meetup在北京、上海、深圳和杭州四个城市举办,其中仅北京就成功举办了5次,内容更涵盖Spark Core、Spark Streaming、Spark MLlib、Spark SQL等众多领域。而作为较早关注和引入Spark的移动互联网大数据综合服务公司,Ta...
分类:其他好文   时间:2015-08-31 13:40:47    阅读次数:354
spark简介
概述 什么是Spark Spark是UC Berkeley AMP lab所开源的类Hadoop MapReduce的通用的并行计算框架,Spark基于map reduce算法实现的分布式计算,拥有Hadoop MapReduce所具有的优点;但不同于MapReduce的是Job中间输出和结果可以保存在内存中,从而不再需要读写HDFS,因此Spark能更好地适用于数据挖掘与机器学习...
分类:其他好文   时间:2015-08-31 13:39:50    阅读次数:279
Spark - RDD(弹性分布式数据集)
org.apache.spark.rddRDDabstract class RDD[T] extends Serializable with LoggingA Resilient Distributed Dataset (RDD), the basic abstraction in Spark. R...
分类:其他好文   时间:2015-08-31 13:20:40    阅读次数:163
Spark入门实战系列--6.SparkSQL(下)--Spark实战应用
SparkSQL引入了一种新的RDD——SchemaRDD,SchemaRDD由行对象(Row)以及描述行对象中每列数据类型的Schema组成;SchemaRDD很象传统数据库中的表。SchemaRDD可以通过RDD、Parquet文件、JSON文件、或者通过使用hiveql查询hive数据来建立。SchemaRDD除了可以和RDD一样操作外,还可以通过registerTempTable注册成临时表,然后通过SQL语...
分类:数据库   时间:2015-08-31 10:08:08    阅读次数:377
Scala - Spark Lambda“goesto“ => 分析
1 /// 定义一个函数AddNoise,参数分别为rdd,Fraction。其中rdd为(BreezeDenseMatrix, BreezeDenseMatrix)元组构成的RDD。Fraction为一个Double。返回一个(BreezeDenseMatrix, BreezeDenseMa...
分类:其他好文   时间:2015-08-30 22:37:58    阅读次数:189
使用Spark和Zeppelin探索movie-lens数据
MovieLens 100k数据包含有100,000条用户与电影的相关数据。 首先下载并解压数据:wget http://files.grouplens.org/datasets/movielens/ml-100k.zip unzip ml-100k.zip cd ml-100k #用户文件(ID,年龄,性别,职业,邮编) zhf@ubuntu:~/Downloads/ml-100k$ head...
分类:其他好文   时间:2015-08-30 21:25:57    阅读次数:250
Apache Spark-1.0.0浅析(十):数据存储——读写操作
“RDD是由不同的partition组成的,transformation和action是在partition上面进行的;而在storage模块内部,RDD又被视为由不同的block组成,对于RDD的存取是以block为单位进行的,本质上partition和block是等价的,只是看待的角度不同。在S...
分类:Web程序   时间:2015-08-30 15:35:01    阅读次数:401
ClassTag 、Manifest、ClassManifest、TypeTag代码实战及其在Spark中的应用源码解析之Scala学习笔记-37
package com.leegh.parameterizationimport scala.reflect.ClassTag/** * @author Guohui Li */class A[T]object Manifest_ClassTag { def main(args: Array[St....
分类:其他好文   时间:2015-08-30 12:38:23    阅读次数:167
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!