码迷,mamicode.com
首页 > 其他好文 > 详细

【面试题】海量数据篇

时间:2019-08-12 01:05:24      阅读:104      评论:0      收藏:0      [点我收藏+]

标签:str   reduce   数据量   归并   red   map   sdn   detail   海量   

所谓海量数据处理,无非就是基于海量数据上的存储、处理、操作。何谓海量,就是数据量太大,所以导致要么是无法在较短时间内迅速解决,要么是数据太大,导致无法一次性装入内存
处理海量数据的基本方法:

  1. 分而治之/hash映射 + hash统计 + 堆/快速/归并排序;
  2. 双层桶划分
  3. Bloom filter/Bitmap;
  4. Trie树/数据库/倒排索引;
  5. 外排序;
  6. 分布式处理之Hadoop/Mapreduce。

参考内容

  1. 教你如何迅速秒杀掉:99%的海量数据处理面试题. https://blog.csdn.net/v_july_v/article/details/7382693
  2. 十道海量数据处理面试题与十个方法大总结. https://blog.csdn.net/v_JULY_v/article/details/6279498

【面试题】海量数据篇

标签:str   reduce   数据量   归并   red   map   sdn   detail   海量   

原文地址:https://www.cnblogs.com/lvjincheng/p/11337461.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!