码迷,mamicode.com
首页 >  
搜索关键字:rowkey    ( 171个结果
Hbase Rowkey设计
因为一直在做hbase的应用层面的开发,所以体会的比较深的一点是hbase的表结构设计会对系统的性能以及开销上造成很大的区别,本篇文章先按照hbase表中的rowkey、columnfamily、column、timestamp几个方面...
分类:其他好文   时间:2014-09-26 02:25:58    阅读次数:240
读书笔记-HBase in Action-第三部分应用-(2)GIS系统
本章介绍用HBase存储、高效查询地理位置信息。 Geohash空间索引 考虑LBS应用中常见的两个问题:1)查找离某地最近的k个地点;2)查找某区域内地点。如果要用HBase实现高效查找,首先要考虑的是空间局部性(Spatial Locality),即位置上相近的点得物理存储在一起。最简单的地理位置数据由两个维度组成:经度X和纬度Y,那么相对应最简单的Rowkey也可以由X和Y组成。Rowk...
分类:其他好文   时间:2014-09-19 22:35:00    阅读次数:449
HBase的put简单对比
方法1: /** * 添加一行数据 * * @param tableName * 表名 * @param columnFamily * 列族名 * @param rowKey * ...
分类:其他好文   时间:2014-09-10 17:09:30    阅读次数:493
hbase读写优化小记
1、region热点: 开始会不断往一个region写,可以预划分region 在rowkey加哈希前缀 对region server数量取余 2、memstore提高写性能,blockcache提高读性能,看需求调整 3、使用bloomfilter,如果大多是scan顺序读,可将block设大些,默认块大小是64K,可以设为128 4、设计好rowkey 5、关闭major comp...
分类:其他好文   时间:2014-08-28 16:58:40    阅读次数:176
Nginx日志导入到Hive0.13.1,同步Hbase0.96.2,设置RowKey为autoincrement(ID自增长)
目录: 一、Nginx的相关配置,以及测试数据 二、Hadoop中创建使用目录 三、Hive的日志表创建,并同步到Hbase中 1)创建自增长ID的类,并添加到Hive环境中 2)在Hive中创建日志表 3)将Nginx的日志数据导入到Hive日志表中 方法一:将本...
分类:其他好文   时间:2014-08-24 14:04:32    阅读次数:246
HBase多条件筛选查询方案
最近的项目需要使用Hbase做实时查询,由于Hbase只支持一级索引,也就是使用rowkey作为索引查询,所以对于多条件筛选查询的支持不够,在不建立二级索引的情况下,只能使用Hbase API中提供的各种filter过滤器进行筛选,感觉查询效率不太理想,于是考虑建立二级索引的方案。 经过goo...
分类:其他好文   时间:2014-07-17 00:53:25    阅读次数:238
读书笔记-HBase in Action-第二部分Advanced concepts-(3)非Java客户端
HBase Shell HBase shell使用起来最方便,进入HBase shell控制台即可使用。 $ $HBASE_HOME/bin/hbase shell 常见操作有create(创建表)/put(插入或更新数据)/get(根据rowkey查询)/scan(范围查询)/delete(删除列)/deleteAll(根据rowkey删除整行数据)/disable&drop(禁用表之后再...
分类:编程语言   时间:2014-07-04 08:12:54    阅读次数:383
读书笔记-HBase in Action-第二部分Advanced concepts-(1)HBase table design
本章以山寨版Twitter为例介绍HBase Schema设计模式。广义的HBase Schema设计不只包括创建表时指定项,还应该综合考虑Column families/Column qualifier/Cell value/Versions/Rowkey等相关内容。 灵活的Schema&简单的存储视图 Schema设计和数据存储及访问模式关系密切,先回顾下HBase数据模型,有几个要点:...
分类:其他好文   时间:2014-07-01 14:35:30    阅读次数:343
HBase应用:Table设计
从应用角度,有两点比较重要: 1. HBase中RowKey是按照字典序排列的 2. 不同Column Family的数据,在物理上是分开的...
分类:其他好文   时间:2014-07-01 06:43:31    阅读次数:203
HBase写性能初步测试
在本机上对线下HBase集群做了初步的写性能测试,下面对测试内容做详细说明。 批量写性能提升不少 线上应用最好是禁用buffer刷写功能的,即每一个Put一次RPC写,不过看到这种情况下写速度慢,考虑到机器、网络环境的差别的话,估计能上1K 启用buffer刷写功能的话,要避免未flush的put记录丢失。(HTable在close的时候最后是会自动flush,我们在写服务节点故障的时候也需要flush一次) Rowkey哈希后性能有小量提升 Rowkey Hash之后对写性能的确有小量提升,但如果要...
分类:其他好文   时间:2014-06-19 10:16:00    阅读次数:296
171条   上一页 1 ... 15 16 17 18 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!