CODE:#!/usr/bin/python # -*- coding: utf-8 -*-'''Created on 2014-7-3@author: guaguastd@name: tweet_lexical_diversity.py''' if __name__ == '__main__...
分类:
编程语言 时间:
2014-11-03 14:27:40
阅读次数:
215
哈希表是一种典型的以空间换取时间的数据结构,在没有冲突的情况下,对任意元素的插入、索引、删除的时间复杂度都是O(1)。这样优秀的时间复杂度是通过将元素的key值以hash方法f映射到哈希表中的某一个位置来访问记录来实现的,即键值为key的元素必定存储在哈希表中的f(key)的位置。当然,不同的元素的hash值可能相同,这就是hash冲突,有两种解决方法(分离链表发和开放地址发),ngx采用的是开放地址法....
分类:
其他好文 时间:
2014-11-03 13:05:13
阅读次数:
363
题目链接:http://poj.org/problem?id=3320题目大意:一本书有P页,每页有个知识点,知识点可以重复。问至少连续读几页,使得覆盖全部知识点。解题思路:知识点是有重复的,因此需要统计不重复元素个数,而且需要记录重复个数。最好能及时O(1)反馈不重复的个数。那么毫无疑问,得使用H...
分类:
其他好文 时间:
2014-11-03 01:17:36
阅读次数:
210
1.1环境准备1.2 Nested Loops Join从上面的试验来看,nested loop jion基本上是没有限制的,可以支持所有的运算。1.3 Hash Join1.4 Merge Sort Join待续。。。。。
分类:
数据库 时间:
2014-11-02 22:18:28
阅读次数:
179
很有意思的一道题目 考场上想的是HASH成一个整数,把末位asicc码值*1,依次乘*10,得到一个整数,然后利用等差性、唯一性快排Nlogn乱搞的 证明如下: 对于明文abcde 密文 bcdef 有(a-b)*10000+(b-c)*1000+(c-d)*100+(d-...
分类:
其他好文 时间:
2014-11-02 09:16:04
阅读次数:
134
嗯,我已经停了四五天课在家刷BZOJ准备复赛了,感觉压力好大。但是,实际上感觉效率并不高,每天就是7-8题的样子,而且并不是每题都有质量。而且这几天刷下来,我貌似因为刷了太多水题的关系,打字写题的速度变慢了,有一点悠闲没有紧迫感了,要赶快把这个习惯给改掉!今天去学校做题被虐了,竟然一个简单的Hash...
分类:
其他好文 时间:
2014-11-01 23:04:56
阅读次数:
322
目录 引言 直接寻址 散列寻址 散列函数 除法散列 乘法散列 全域散列 完全散列 碰撞处理方法 链表法 开放寻址法 线性探查 二次探查 双重散列 随机散列 再散列问题 完整源码(C++) 参考资料内容 1、引言 ...
分类:
编程语言 时间:
2014-11-01 21:45:34
阅读次数:
527
很多系统都是将密码进行一次 MD5 或 SHA1 Hash后存入数据库中。这样的密码抵挡不住字典攻击。所谓字典攻击,就是将常用密码进行Hash后做成一个字典,破解的时候,只需要查字典就能知道对应的明文密码。为了抵御字典攻击,推荐的做法是使用 密码 + 盐(一串随机数) 再Hash的方式。每个密码对应...
分类:
数据库 时间:
2014-10-31 23:32:38
阅读次数:
260
题目链接:http://poj.org/problem?id=1200分析:从数据来看,该题目使用线性时间算法,可见子串的比较是不可能的;使用hash可以在常数时间内查找,可以常数时间内判重,可以再线性时间内解决问题;问题关键在与Hash函数的选择,使得子串之间的Hash值不同;由于NC的提示,使用...
分类:
其他好文 时间:
2014-10-31 20:29:34
阅读次数:
245
先上个规划图,自己随便画的,大家也随便看看192.168.1.119为nginx做反向代理并处理静态页面,apache处理动态页面,nfs共享网站家目录,svn代码管理。192.168.101为apache处理动态页面,挂载192.168.1.119的共享目录。192.168.1.96为mysql数据库,允许两台web服务的连接权限。..
分类:
Web程序 时间:
2014-10-31 19:14:13
阅读次数:
314