从Physical plan到Map-Reduce Plan
注:因为我们重点关注的是Pig On Spark针对RDD的执行计划,所以Pig物理执行计划之后的后端参考意义不大,这些部分主要分析流程,忽略实现细节。
入口类MRCompiler,MRCompilier按照拓扑顺序遍历物理执行计划中的节点,将其转换为MROperator,每个MROperator都代表一个map-reduce
j...
分类:
其他好文 时间:
2014-05-10 08:46:07
阅读次数:
366
原文地址:http://onlyonewt.blog.sohu.com/160168896.html一直在学习关注大访问量网站的缓存是如何实现,之前看过Memcached的资料,忙于没有时间来真正测试一下,今天测试下分布式缓存Memcached首先要在缓存服务器上安装安装:memcached(1.2...
分类:
Web程序 时间:
2014-05-07 21:25:46
阅读次数:
593
git是什么?
简单介绍一下,Git是一个开源的分布式版本控制系统,用以有效、高速的处理从很小到非常大的项目版本管理。Git是目前世界上最先进的分布式版本控制系统,没有传说中的之一。
Git诞生?
Git 是 Linus为了帮助管理 Linux 内核开发而开发的一个开放源码的版本控制软件。在过去一段时间里,Linux的开发并没有使用到版本控制,天呐!Linux这么牛逼的系统曾经在开发过程中居...
分类:
其他好文 时间:
2014-05-07 16:20:53
阅读次数:
329
Matlab图像彩色转灰色,附上自己拍照照片及处理。...
分类:
其他好文 时间:
2014-05-07 16:18:53
阅读次数:
404
Explain
Explain是Pig提供的调试工具,使用explain可以输出Pig Lation的执行计划。值得一提的是,explain支持-dot选项,将执行计划以DOT格式输出, (DOT是一种图形描述语言,请参考http://zh.wikipedia.org/zh/DOT%E8%AF%AD%E8%A8%80)
代码实现详见org.apache.pig.impl.plan.DotPla...
分类:
其他好文 时间:
2014-05-07 06:03:35
阅读次数:
350
OpenCV坐标系与MATLAB中矩阵行与列的对应...
分类:
其他好文 时间:
2014-05-07 04:54:58
阅读次数:
549
一直在写c++程序,不过对于一些作图程序来说,还是MATLAB比较实在。
de Casteljau算法是作贝塞尔曲线的一种高效的算法,其思想就是对[0,1]区间中所有的t,通过n个控制顶点不断递推得到一个顶点:下面是我的代码实现:
function deCasteljau(P,Q)
%P is 1*n matrix for X
%Q is 1*n matrix for...
分类:
其他好文 时间:
2014-05-07 03:14:37
阅读次数:
303
我的理解是服务层是处于我的应用程序业务层和表现层之间的应用程序边界,边界可能是很薄的一层类设计或者是分布式服务网络跃点。它是一个与技术无关的名词。由表现层直接调用,契约,执行命令(修改状态(CUD))或者是查询返回dto(数据迁移对象)(cms,命令-查询分离)。他对业务逻辑层接口很清楚,组织业务逻辑 微服务形成宏服务,适配表现层。...
分类:
其他好文 时间:
2014-05-07 03:10:34
阅读次数:
337
参考书籍: Hadoop in action, 吴超沉思录1.Hbase简介
1.面向列的分布式数据库 2. 以HDFS作为文件系统 3. 利用MapReduce处理Hbase中海量数据 4. ZookKeeper作为协调工具 5.
sqoop提供Hbase到关系型数据库中数据导入功能 ...
分类:
其他好文 时间:
2014-05-07 00:35:59
阅读次数:
424