码迷,mamicode.com
首页 >  
搜索关键字:spark 安装、介绍    ( 7164个结果
即时通讯之smack客户端配置
之前学习了通过Openfire+spark+smack的模式来完成我们的即时通讯软件,上次我们已经完成了Openfire的安装和配置,这次我们继续完成我们的客户端部分。
分类:系统相关   时间:2015-03-09 15:46:28    阅读次数:250
spark自带示例一
/**LicensedtotheApacheSoftwareFoundation(ASF)underoneormore*contributorlicenseagreements.SeetheNOTICEfiledistributedwith*thisworkforadditionalinformationregardingcopyrightownership.*TheASFlicensesthisfiletoYouundertheApacheLicense,Version2.0*(the"License");..
分类:其他好文   时间:2015-03-09 01:49:40    阅读次数:390
Apache Spark技术实战之8:Standalone部署模式下的临时文件清理
Spark运行过程中资源的申请和释放一直是源码分析时需要关注的重点,从资源种类上来说,有CPU、内存、网络、磁盘,其中前三者会在进程退出时由OS来负责释放。而占用的磁盘资源,如果Spark自身不及时的清理,就势必会造成文件的堆积,直至磁盘被占满不可用。 因此有必要弄清楚Spark运行过程中产生的临时...
分类:Web程序   时间:2015-03-08 21:21:50    阅读次数:355
spark的eclispe的集成开发环境的搭建
默认已经安装了jdk和scala 下面说一下spark的eclispe的集成开发环境的搭建 eclipse4.2 update-site.zip spark-1.0.2-bin-hadoop2.tgz 解压spark-1.0.2-bin-hadoop2.tgz,得到lib文件夹下的jar包spark-assembly-1.1.1-hadoop2.3.0.jar 下面开始进行配置 打开e...
分类:其他好文   时间:2015-03-07 21:22:05    阅读次数:257
Spark核心—RDD初探
本文目的 最近在使用Spark进行数据清理的相关工作,初次使用Spark时,遇到了一些挑(da)战(ken)。感觉需要记录点什么,才对得起自己。下面的内容主要是关于Spark核心—RDD的相关的使用经验和原理介绍,作为个人备忘,也希望对读者有用。 为什么选择Spark 原因如下 代码复用:使用Sca...
分类:其他好文   时间:2015-03-07 21:09:45    阅读次数:281
sparkstreaming源码分析
做个笔记,记录streaming任务执行的整个流程,下文使用的源码是master分支的代码,1.2.1版本已经发布,应该和1.2.1差别不大1、streaming程序是从StreamingContext.start()开始的,做一个必要的参数检查然后启动jobschedulerStreamingContext.scaladefstart():Unit=synchronized..
分类:其他好文   时间:2015-03-06 19:18:24    阅读次数:322
IDEA的auto import 与 Scala的隐式转换
设置IDEA的auto import 之后,编写Spark应用程序时的一些自动导入情况及其说明。 1.普通类的自动导入 var cnames = new ArrayBuffer[String]() var ips = new ArrayBuffer[String]()直接根据提示alt+enter便可以导入ArrayBuffer类包 2.需要隐式转换 val joinRDD = r...
分类:其他好文   时间:2015-03-05 23:46:21    阅读次数:712
ALS矩阵分解推荐模型
ALS矩阵分解推荐模型 其实通过模型来预测一个user对一个item的评分,思想类似线性回归做预测,大致如下 定义一个预测模型(数学公式), 然后确定一个损失函数, 将已有数据作为训练集, 不断迭代来最小化损失函数的值, 最终确定参数,把参数套到预测模型中做预测。   矩阵分解的预测模型是: 损失函数是: 我们就是要最小化损失函数,从而求得参...
分类:其他好文   时间:2015-03-05 22:24:01    阅读次数:545
Spark源码学习1.4——MapOutputTracker.scala
相关类:MapOutputTrackerMessage,GetMapOutputStatuses extends MapPutputTrackerMessage,StopMapOutputTracker extends MapOutputTrackerMessage,MapOutputTracker...
分类:其他好文   时间:2015-03-05 21:00:56    阅读次数:223
Spark访问HDFS
来自 Gitbook上的“Spark访问HDFS”   http://chenzhongpu.gitbooks.io/bigdatanotes/content/SparkAccessHDFS/README.html 该书是关于大数据读书笔记的,目前在Gitbook上持续更新 。  Github地址:https://github.com/ChenZhongPu/BigDataGi...
分类:其他好文   时间:2015-03-05 20:59:02    阅读次数:119
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!