码迷,mamicode.com
首页 > 其他好文 > 详细

spark总结5 RDD

时间:2017-09-16 18:56:19      阅读:141      评论:0      收藏:0      [点我收藏+]

标签:reduce   scala集合   集合   创建   序列   order   hdf   collect   dfs   

创建RDD 有两种方式

 

1 通过hdfs支持的文件系统创建 RDD, RDD里面没有真正要计算的数据,只记录了一下元数据

2 从过scala集合或者数组以并行化的方式创建RDD

 

collect 把结果收集起来放到 scala数组里面

reduce 汇聚 方法传进去

 

count   rdd有多少元素

top(2) 取RDD 最大的前两个

take(2)取RDD前两个

first  想到与 take(1)

takeOrdered(2,(排序规则))  拍完序列 取前两个

 

spark总结5 RDD

标签:reduce   scala集合   集合   创建   序列   order   hdf   collect   dfs   

原文地址:http://www.cnblogs.com/toov5/p/7531802.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!