原型: def reduceByKeyLocally(func: (V, V) => V): Map[K, V] 该函数将RDD[K,V]中每个K对应的V值根据映射函数来运算,运算结果映射到一个Map[K,V]中,而不是RDD[K,V] scala> var rdd1 = sc.makeRDD(Ar ...
分类:
其他好文 时间:
2016-07-31 00:02:05
阅读次数:
312
布隆过滤器(BloomFilter)是由布隆(BurtonHowardBloom)在1970年提出的。它实际上是由一个很长的二进制向量和一系列随机映射函数组成,布隆过滤器可以用于检索一个元素是否在一个集合中。它的优点是空间效率和查询时间都远远超过一般的算法,缺点是有一定的误识别率(假正例F..
分类:
其他好文 时间:
2016-07-25 16:31:26
阅读次数:
239
什么是布隆过滤器布隆过滤器(BloomFilter)是1970年由布隆提出的。它实际上是一个很长的二进制向量和一系列随机映射函数。布隆过滤器可以用于检索一个元素是否在一个集合中。它的优点是空间效率和查询时间都远远超过一般的算法,缺点是有一定的误识别率和删除困难。实现思想如..
分类:
其他好文 时间:
2016-07-05 06:30:45
阅读次数:
142
HashTable-散列表/哈希表,是根据关键字(key)而直接访问在内存存储位置的数据结构。 它通过一个关键值的函数将所需的数据映射到表中的位置来访问数据,这个映射函数叫做散列函数,存放记录的数组叫做散列表。 构造哈希表的几种方法1. 直接定址法--取关键字的某个线性函数为散列地址,Hash(Ke ...
分类:
其他好文 时间:
2016-07-01 22:56:49
阅读次数:
211
部分重映射和完全重映射 与开启重映射函数的函数的第一个参数有关。 ...
分类:
其他好文 时间:
2016-06-19 17:00:46
阅读次数:
194
转载自http://www.cnblogs.com/haippy/archive/2012/07/13/2590351.html 布隆过滤器[1](Bloom Filter)是由布隆(Burton Howard Bloom)在1970年提出的。它实际上是由一个很长的二进制向量和一系列随机映射函数组成 ...
分类:
其他好文 时间:
2016-06-13 23:29:14
阅读次数:
268
哈希表也称为散列表,是根据关键字值(key value)而直接进行访问的数据结构。也就是说,它通过把关键字值映射到一个位置来访问记录,以加快查找的速度。这个映射函数称为哈希函数(也称为散列函数),映射过程称为哈希化,存放记录的数组叫做散列表。比如我们可以用下面的方法将关键字映射成数组的下标:arrayIndex
= hugeNumber % arraySize。
哈希化之...
分类:
其他好文 时间:
2016-06-12 03:27:45
阅读次数:
211
同样是看别人代码时发现的,作者使用了MmGetPhysicalAddress和MmMapIoSpace这两个函数,之前从来没看过这两个函数还以为是作者自己写的呢。后来查了一下WDK原来是有文档的函数。作者是用这个函数把缓存模型I/O的地址取物理地址之后再映射出虚拟地址,虽然我没发现这么做有什么意义, ...
分类:
其他好文 时间:
2016-06-02 23:12:32
阅读次数:
2218
HashTable-散列表/哈希表,是根据关键字(key)而直接访问在内存存储位置的数据结构。它通过一个关键值的函数将所需的数据映射到表中的位置来访问数据,这个映射函数叫做散列函数,存放记录的数组叫做散列表。构造哈希表的几种方法直接定址法--取关键字的某个线性函数为散列地..
分类:
编程语言 时间:
2016-05-31 19:10:42
阅读次数:
388
哈希表(Hash Table,又叫散列表),是存储键值对(Key-value)的表,之所以不叫它Map(键值对一起存储一般叫做Map),是因为它下面的特性:它能把关键码(key)映射到表中的一个位置来直接访问,这样访问速度就非常快。其中的映射函数称为散列函数(Hash function)。 1) 对 ...
分类:
编程语言 时间:
2016-05-29 16:31:42
阅读次数:
190