在MR中我们在Map阶段的排序可是通过两种方式 要比较的值为key 1)实现WriteComparator接口 比较简单使用 2)自定义比较器(实现RawComparator接口) 这里我们介绍一下第二种方式 1、我们要自定义一个比较器实现RawComparator接口 2、重写方法 为什么有两个方 ...
分类:
其他好文 时间:
2020-03-03 13:11:31
阅读次数:
76
首先需要明确的是,hadoop里的key一定要是可排序的,要么key自身实现了WritableComparator接口,要么有一个排序类可以对key进行排序。如果key本身不实现WritableComparator接口,而是由另外的一个工具类(实现RawComparator接口)来提供排序的话,需要 ...
分类:
编程语言 时间:
2018-01-28 23:20:34
阅读次数:
189
本文发表于本人博客。今天接着上次【Hadoop mapreduce自定义排序WritableComparable】文章写,按照顺序那么这次应该是讲解自定义分组如何实现,关于操作顺序在这里不多说了,需要了解的可以看看我在博客园的评论,现在开始。 首先我们查看下Job这个类,发现有setGrouping...
分类:
其他好文 时间:
2015-01-23 22:57:59
阅读次数:
258
本篇文章结合源代码学习了RawComparator接口及其实现,并分析了不同实现的区别...
分类:
其他好文 时间:
2014-12-19 15:48:48
阅读次数:
171