在本机上对线下HBase集群做了初步的写性能测试,下面对测试内容做详细说明。
批量写性能提升不少
线上应用最好是禁用buffer刷写功能的,即每一个Put一次RPC写,不过看到这种情况下写速度慢,考虑到机器、网络环境的差别的话,估计能上1K
启用buffer刷写功能的话,要避免未flush的put记录丢失。(HTable在close的时候最后是会自动flush,我们在写服务节点故障的时候也需要flush一次)
Rowkey哈希后性能有小量提升
Rowkey Hash之后对写性能的确有小量提升,但如果要...
分类:
其他好文 时间:
2014-06-19 10:16:00
阅读次数:
296
表连接有嵌套循环(nested loop join) 哈希连接(hash join)
排序合并(merge sort join)这三种表连接的应用比例为70%,20%,10%各类连接访问次数差异alter session set
statistics_level=all 这种跟踪方式 显著特点,可以...
分类:
其他好文 时间:
2014-06-16 09:10:15
阅读次数:
199
在多台后台服务器的环境下,我们为了确保一个客户只和一台服务器通信,我们势必使用长连接。使用什么方式来实现这种连接呢,常见的有使用nginx自带的ip_hash来做,我想这绝对不是一个好的办法,如果前端是CDN,或者说一个局域网的客户同时访问服务器,导致出现服务器分配不均衡,以及不能保证每次访问都粘滞...
分类:
其他好文 时间:
2014-06-16 07:24:48
阅读次数:
237
Bloom filter的实现以及常用的hash函数
bloom filter利用时间换空间的思想,利用多个哈希函数,将一个元素的存在状态映射到多个bit中,特别是在网络环境中,BF具有广泛的用途,关键问题就是要减少false positive rate(可以设置参数来调节),扩展有 counting BF。这里选用的hash函数是表现较好的 BKDRHash , SDBMHash, D...
分类:
其他好文 时间:
2014-06-13 20:42:05
阅读次数:
412
有这样一个业务场景,需要在2个表里比较存在于A表,不存在于B表的数据。表结构如下:T_SETTINGS_BACKUP | CREATE TABLE
`T_SETTINGS_BACKUP` ( `FID` bigint(20) NOT NULL AUTO_INCREMENT, `FUSERID` .....
分类:
数据库 时间:
2014-06-12 21:32:15
阅读次数:
453
Object
class中,也定义了toString()这个方法,因此所有的class也都继承这个方法。默认是传回这个对象完整类别名称,后面接一个"@",及一个不带正副号的十六进制hash码。
分类:
编程语言 时间:
2014-06-12 19:36:13
阅读次数:
223
“摘要”式认证(Digest
authentication)是一个简单的认证机制,最初是为HTTP协议开发的,因而也常叫做HTTP摘要,在RFC2671中描述。其身份验证机制很简单,它采用杂凑式(hash)加密方法,以避免用明文传输用户的口令。摘要认证就是要核实,参与通信的双方,都知道双方共享的..
分类:
其他好文 时间:
2014-06-10 22:58:10
阅读次数:
404
作者:长野雅广(Masahiro Nagano)
原文链接:http://gihyo.jp/dev/feature/01/memcached/0004
我是Mixi的长野。 第2次、 第3次 由前坂介绍了memcached的内部情况。本次不再介绍memcached的内部结构,
开始介绍memcached的分布式。
memcached的分布式
正如第1次中介绍的那样, me...
分类:
其他好文 时间:
2014-06-10 18:35:09
阅读次数:
288
Memcached分布式缓存策略不是由服务器端至支持的,多台服务器之间并不知道彼此的存在。分布式的实现是由客户端代码(Memcached.ClientLibrary)通过缓存key-server映射来实现的,基本原理就是对缓存key求hash值,用hash值对服务器数量进行模运算,该key值被...
分类:
其他好文 时间:
2014-06-10 12:27:01
阅读次数:
323