一、hadoop的起源Apache Lucene 开源的高性能全文检索工具包Apache Nutch 开源的web搜索引擎google的三篇论文 GFS -> HDFS MapReduce -> MapReduce BigTable -> HBaseApache Hadoop 大规模数据处理 二、h ...
分类:
其他好文 时间:
2017-05-22 00:19:37
阅读次数:
266
海量日志数据,提取出某日访问百度次数最多的那个IP。 既然是海量数据处理,那么可想而知,给我们的数据那就一定是海量的。 针对这个数据的海量,我们如何着手呢?对的,无非就是分而治之/hash映射 + hash统计 + 堆/快速/归并排序,说白了,就是先映射,而后统计,最后排序: 分而治之/hash映射 ...
分类:
编程语言 时间:
2017-05-15 18:23:01
阅读次数:
197
统计难题 Time Limit: 4000/2000 MS (Java/Others) Memory Limit: 131070/65535 K (Java/Others) Total Submission(s): 23029 Accepted Submission(s): 9640 Problem ...
分类:
其他好文 时间:
2017-04-22 09:25:54
阅读次数:
160
对于第一问:无修改的查询区间GCD,可以采用RMQ倍增的思想。 第二问:可以预处理。暴力枚举左端点L。GCD从左到右是递减的,并且肯定是有一些段是一样的值,值的种类最多只有log(1000, 000, 000)种,因此可以二分确定每一段的范围。然后用map统计一下即可。 ...
分类:
其他好文 时间:
2016-07-21 23:45:33
阅读次数:
243
题意:就是不存在环,而且各点相互连通 分析:就是一颗树,树的条件,连通,不含圈,边恰好为n-1个,只要满足其中两个条件就可以了,这道题统计节点个数,可以用set,map统计,用并查集判断是否存在圈,只要注意空树也是正确答案就行了 代码: 2016/2/8 #include<bits/stdc++.h
分类:
其他好文 时间:
2016-02-08 21:23:43
阅读次数:
182
题目链接n个数m个询问, 每次询问输出给定区间中任意两个相同的数的最近距离。先将询问读进来, 然后按r从小到大排序, 将n个数按顺序插入, 并用map统计之前是否出现过, 如果出现过, 就更新线段树。如果当前的i等于某个询问的r, 那么就查询, 具体看代码。 1 #include 2 #inc...
分类:
其他好文 时间:
2015-12-27 16:03:09
阅读次数:
280
解题思路:
本题h的取值范围太大,所以无法直接开数组统计
1、 map统计
2、排序+二分
3、hash
4、优先队列
#include
#include
#include
#include
#define MAXN 1000010
using namespace std;
struct node{
int id;
int h;
}q[MAXN];
int ans...
分类:
其他好文 时间:
2015-08-03 14:50:14
阅读次数:
103
统计难题
Time Limit: 4000/2000 MS (Java/Others) Memory Limit: 131070/65535 K (Java/Others)
Total Submission(s): 23029 Accepted Submission(s): 9640
Problem Description
Ignatius最近遇到一个难题,老师交给他很多单词(只有...
分类:
其他好文 时间:
2015-07-27 18:50:06
阅读次数:
104
题目:选课系统,每个人选5门课,如果很多人选择相同5门课认为这个组合比较热门,
现在要求出选择最热门课程组合的选择人数。
分析:数据结构,STL。对每组数据先排序,然后利用map统计求解即可。
(也可以使用hash表或者利用long long压缩排序统计)
说明:如果有很多人们组合,都算在一起。
#include
#include
#i...
分类:
其他好文 时间:
2015-07-21 10:40:24
阅读次数:
139
【来源】题目2 : 字符串压缩【分析】把游程编码恢复为原始字符串,然后得出每一行的字符串的内容,放在一个vector中。用map统计vector中每一行的反复的次数。比較两个游程编码得到的map是否同样就可以。该算法占用空间太多,小数据AC,大数据MLE了。【代码】#include #include...
分类:
其他好文 时间:
2015-04-01 15:16:08
阅读次数:
104