码迷,mamicode.com
首页 > 其他好文 > 详细

Pig parallel reduce并行执行数

时间:2015-06-07 23:05:43      阅读:411      评论:0      收藏:0      [点我收藏+]

标签:

    parallel语句可以附加到Pig Latin中任一个关系操作符后面,然后它会控制reduce阶段的并行,因此只有对与可以触发reduce过程的操作符才有意义。

    可以触发reduce过程的操作符有:group、order、distinct、join、cogroup、cross
 
设置parallel的方法:
 
1)在操作符后面
data = load ‘data‘;
grpd = group data by $0 parallel 10;
sorted = order data by $0 parallel 2;

   

2)set default_parallel n
 
parallel的数值设置多少是合理的??
 
parallel只能控制reduce过程的并行,对与map过程的控制,可以通过用户自定义的加载函数实现,重写自己的InputFormat。

Pig parallel reduce并行执行数

标签:

原文地址:http://www.cnblogs.com/lishouguang/p/4559610.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!