Hive是基于Hadoop的开源数据仓库工具,提供了类似于SQL的HiveQL语言,使得上层的数据分析人员不用知道太多MapReduce的知识就能对存储于Hdfs中的海量数据进行分析。由于这一特性而收到广泛的欢迎。Hive的整体框架中有一个重要的模块是执行模块,这一部分是用Hadoop中MapRed...
分类:
其他好文 时间:
2014-05-30 14:23:07
阅读次数:
409
自从建了Spark交流的QQ群之后,热情加入的同学不少,大家不仅对Spark很热衷对于Storm也是充满好奇。大家都提到一个问题就是有关storm内部实现机理的资料比较少,理解起来非常费劲。尽管自己也陆续对storm的源码走读发表了一些博文,当时写的时候比较匆忙,有时候衔接的不是太好,此番做了一些整...
分类:
其他好文 时间:
2014-05-30 07:25:09
阅读次数:
286
分布式数据集创建之textFile
文本文件的RDDs能够通过SparkContext的textFile方法创建,该方法接受文件的URI地址(或者机器上的文件本地路径,或者一个hdfs://,
sdn://,kfs://,其他URI).这里是一个调用样例:scala> val distFile...
分类:
其他好文 时间:
2014-05-29 18:58:27
阅读次数:
429
VS 2012 + NDK + ADT 环境部署由于项目需要需要配置
VS2012+NDK+ADT的开发环境,这里给大家介绍一下,并在下一章介绍NDK的开发:需要工具:Microsoft Visual Studio 2012
UltimateAndroid NDKAndroidADTCygwin f...
分类:
其他好文 时间:
2014-05-23 23:12:15
阅读次数:
307
VS 2012 + NDK + ADT 开发(Cocos2d-x 3.1rc0开发 )PART
1在上一章里,我们介绍了VS2012+NDK+ADT+CGYWIN的环境部署,在这一章里,我们将会利用已搭建的环境来示范NDK的开发过程;为了同时介绍一下Cocos2d-x,这里将以Cocos2d-x作为...
分类:
其他好文 时间:
2014-05-23 10:54:11
阅读次数:
254
折腾了好几天,终于可以在CenOS下用eclipse写spark程序了当前环境是CentOS6.5,jdk7,scala2.10.4,spark0.9.1前期因为对linux不熟悉的原因花了不少时间查阅命令。折腾了不少时间,终于把jdk8,scala2.11.0环境变量配置好了。在此环境下可以正常编...
分类:
其他好文 时间:
2014-05-23 06:01:28
阅读次数:
312
Hadoop 运行环境准备运行环境部署结构介绍Linux
CentOS6.5安装(Hadoop环境配置)Linux
常用远程管理工具介绍SSH免密码登录配置Hadoop安装及配置Hadoop验证-WordCount执行Hadoop开发工具准备Hadoop Eclipse
Plugin配置安装及验证H...
分类:
其他好文 时间:
2014-05-23 02:41:15
阅读次数:
211
本来源码编译没有什么可说的,对于java项目来说,只要会点maven或ant的简单命令,依葫芦画瓢,一下子就ok了。但到了Spark上面,事情似乎不这么简单,按照spark
officical document上的来做,总会出现这样或那样的编译错误,让人懊恼不已。
分类:
其他好文 时间:
2014-05-18 20:25:57
阅读次数:
391
Hadoop2中的Yarn是一个分布式计算资源的管理平台,由于其有极好的模型抽象,非常有可能成为分布式计算资源管理的事实标准。其主要职责将是分布式计算集群的管理,集群中计算资源的管理与分配。Yarn为应用程序开发提供了比较好的实现标准,Spark支持Yarn部署,本文将就Spark如何实现在Yarn...
分类:
其他好文 时间:
2014-05-16 04:20:26
阅读次数:
455