环境:
Unbunt 12.04
Hadoop 2.2.x
Sprak 0.9
Scala scala-2.9.0.final.tgz
步骤
1. 下载 scala
2. 解压scala,然后修改/etc/profile,添加如下
export SCALA_HOME=/home/software/scala-2.9.0.final
export PATH=$P...
分类:
其他好文 时间:
2014-06-05 11:52:46
阅读次数:
484
RDD的依赖关系Rdd之间的依赖关系通过rdd中的getDependencies来进行表示,在提交job后,会通过在DAGShuduler.submitStage-->getMissingParentStagesprivatedefgetMissingParentStages(stage:
Stag...
分类:
其他好文 时间:
2014-05-31 05:09:58
阅读次数:
331
Hive是基于Hadoop的开源数据仓库工具,提供了类似于SQL的HiveQL语言,使得上层的数据分析人员不用知道太多MapReduce的知识就能对存储于Hdfs中的海量数据进行分析。由于这一特性而收到广泛的欢迎。Hive的整体框架中有一个重要的模块是执行模块,这一部分是用Hadoop中MapRed...
分类:
其他好文 时间:
2014-05-30 14:23:07
阅读次数:
409
自从建了Spark交流的QQ群之后,热情加入的同学不少,大家不仅对Spark很热衷对于Storm也是充满好奇。大家都提到一个问题就是有关storm内部实现机理的资料比较少,理解起来非常费劲。尽管自己也陆续对storm的源码走读发表了一些博文,当时写的时候比较匆忙,有时候衔接的不是太好,此番做了一些整...
分类:
其他好文 时间:
2014-05-30 07:25:09
阅读次数:
286
分布式数据集创建之textFile
文本文件的RDDs能够通过SparkContext的textFile方法创建,该方法接受文件的URI地址(或者机器上的文件本地路径,或者一个hdfs://,
sdn://,kfs://,其他URI).这里是一个调用样例:scala> val distFile...
分类:
其他好文 时间:
2014-05-29 18:58:27
阅读次数:
429
1、 边缘提取算法 方法一:一阶微分算子 Sobel算子
Sobel算子检测方法对灰度渐变和噪声较多的图像处理效果较好,Sobel算子对边缘定位不是很准确,图像的边缘不止一个像素。 Roberts算子
Roberts算子检测方法对具有陡峭的低噪声的图像处理效果较好,但是...
分类:
其他好文 时间:
2014-05-23 11:39:55
阅读次数:
757
折腾了好几天,终于可以在CenOS下用eclipse写spark程序了当前环境是CentOS6.5,jdk7,scala2.10.4,spark0.9.1前期因为对linux不熟悉的原因花了不少时间查阅命令。折腾了不少时间,终于把jdk8,scala2.11.0环境变量配置好了。在此环境下可以正常编...
分类:
其他好文 时间:
2014-05-23 06:01:28
阅读次数:
312
计算机视觉之一:特征检测主要内容:1、一个例子解释为什么要进行特征检测2、图像特征3、点特征检测:Harris角点、MOPS、SIFT4、边缘检测:一阶微分算子、二阶微分算子、Canny算子一、为什么要检测特征?举一个例子:全景图像拼接,给定两张图像,如何拼接成一张大图?步骤一:检测特征点步骤二:匹...
分类:
其他好文 时间:
2014-05-19 18:12:09
阅读次数:
447
Navier-Stokes equations1 Let $\omega$ be a domain
in $\bbR^3$, complement of a compact set $\mathcal{B}$. Consider the following
boundary value proble...
分类:
其他好文 时间:
2014-05-19 14:27:04
阅读次数:
498