Hash是把锋利的刀子,处理海量数据时经常用到,大家可能经常用hash,但hash的有些特点你是否想过、理解过。我们可以利用我们掌握的概率和期望的知识,来分析Hash中一些有趣的问题,比如:
平均每个桶上的项的个数
平均查找次数
平均冲突次数
平均空桶个数
使每个桶都至少有一个项的项个数的期望
本文hash的采用链地址法发处理冲突,即对hash值相同的不同对象添加到ha...
分类:
其他好文 时间:
2016-04-15 12:06:08
阅读次数:
173
01.01_计算机基础知识(计算机概述)(了解) A:什么是计算机?计算机在生活中的应用举例 计算机(Computer)全称:电子计算机,俗称电脑。是一种能够按照程序运行,自动、高速处理海量数据的现代化智能电子设备。由硬件和软件所组成,没有安装任何软件的计算机称为裸机。常见的形式有台式计算机、笔记本 ...
分类:
其他好文 时间:
2016-04-03 21:47:06
阅读次数:
231
《世界是数字的》这本书大概讲述了计算机是一种用于高速计算的电子计算机器,可以进行数值计算,又可以进行逻辑计算,还具有存储记忆功能。是能够按照程序运行,自动、高速处理海量数据的现代化智能电子设备。由硬件系统和软件系统所组成,没有安装任何软件的计算机称为裸机。 我们生活在一个被数字包围的时代。信息瞬息万 ...
分类:
其他好文 时间:
2016-03-31 18:27:17
阅读次数:
186
《世界是数字的》这本书大概讲述了计算机是一种用于高速计算的电子计算机器,可以进行数值计算,又可以进行逻辑计算,还具有存储记忆功能。是能够按照程序运行,自动、高速处理海量数据的现代化智能电子设备。由硬件系统和软件系统所组成,没有安装任何软件的计算机称为裸机。 我们生活在一个被数字包围的时代。信息瞬息万 ...
分类:
其他好文 时间:
2016-03-31 18:26:40
阅读次数:
125
《世界是数字的》这本书大概讲述了计算机是一种用于高速计算的电子计算机器,可以进行数值计算,又可以进行逻辑计算,还具有存储记忆功能。是能够按照程序运行,自动、高速处理海量数据的现代化智能电子设备。由硬件系统和软件系统所组成,没有安装任何软件的计算机称为裸机。 这本书介绍了计算机的逻辑构造和物理结构。计 ...
分类:
其他好文 时间:
2016-03-30 23:45:17
阅读次数:
221
概述在分布式实时计算领域,如何让框架/引擎足够高效地在内存中存取、处理海量数据是一个非常棘手的问题。在应对这一问题上Flink无疑是做得非常杰出的,Flink的自主内存管理设计也许比它自身的知名度更高一些。正好最近在研读Flink的源码,所以开两篇文章来谈谈Flink的内存管理设计。...
分类:
其他好文 时间:
2016-03-26 07:53:27
阅读次数:
239
我们每天都在使用数据库,我们部门使用最多的关系数据库有Sqlserver,Oracle,有没有想过这些数据库是怎么存放到操作系统的文件中的?有时候为了能够设计出最优的表结构,写出高性能的Sqlserver脚本,处理海量数据并发,我们必须解底层原理。由于个人兴趣最近研究了下Sqlserver的文件存储
分类:
数据库 时间:
2016-03-17 19:05:44
阅读次数:
313
数据库的分类1.小型数据库access,foxbase负载量小,1000人内,比如留言本,成本千元以内2.中型数据库sqlserver,mysql,informix日访问量10000——15000,成本在万元3.大型数据库oracle,db2,sybase负载可以处理海量数据安全性很高,本身昂贵做项目该选取哪种数据库的依据:1.项目..
分类:
数据库 时间:
2016-03-10 02:02:14
阅读次数:
243
数据库的分类1.小型数据库access,foxbase负载量小,1000人内,比如留言本,成本千元以内2.中型数据库sqlserver,mysql,informix日访问量10000——15000,成本在万元3.大型数据库oracle,db2,sybase负载可以处理海量数据安全性很高,本身昂贵做项目该选取哪种数据库的依据:1.项目..
分类:
数据库 时间:
2016-03-10 02:00:38
阅读次数:
230
基于lucene的分页有两种: lucene3.5之前分页提供的方式为再查询方式(每次查询全部记录,然后取其中部分记录,这种方式用的最多),lucene官方的解释:由于我们的速度足够快。处理海量数据时,内存容易内存溢出。 lucene3.5以后提供一个searchAfter,这个是在特大数据量采用....
分类:
Web程序 时间:
2015-12-09 23:14:04
阅读次数:
235