Hbase 是一个分布式的、面向列的开源数据库,其实现是建立在google 的bigTable 理论之上,并基于hadoop HDFS文件系统。 Hbase不同于一般的关系型数据库(RDBMS)。是一种适用于非结构化数据存储的数据库,且Hbase是基于列的数据库。 下面的内容基于我们已经安装好h.....
分类:
其他好文 时间:
2014-09-02 19:37:55
阅读次数:
217
HBase扩展和负载均衡的基本单位是Region。Region从本质上说是行的集合。当Region的大小达到一定的阈值,该Region会自动分裂(split),当然也可能是合并(merge),合并可以减少Region和相应存储文件的数量(请注意目前HBase[0.94版]不支持在线的Region合并...
分类:
其他好文 时间:
2014-09-02 17:19:54
阅读次数:
227
简介环境:window7 x64Eclipse Java EE IDE for Web Developers.(Version: Kepler Service Release 1)(Build id: 20130919-0819)HBase (hbase-0.98.3-hadoop2-bin.tar...
分类:
编程语言 时间:
2014-09-02 17:16:45
阅读次数:
496
Mysql查找如何判断字段是否包含某个字符串有这样一个需求,在Mysql数据库字符串字段(权限)中,用户有多个不同的邮箱,分别被‘,’分开,现在要取出某个邮箱的所有成员列表。假设有个表:CREATE TABLE users(id int(6) NOT NULL AUTO_INCREMENT,PRIM...
分类:
数据库 时间:
2014-09-02 15:44:51
阅读次数:
190
HBase是Google Bigtable的开源实现,它利用Hadoop HDFS作为其文件存储系统,利用Hadoop MapReduce来处理HBase中的海量数据,利用Zookeeper作为协同服务。1. 简介HBase是一个分布式的、面向列的开源数据库,源于google的一篇论文《bigtab...
分类:
其他好文 时间:
2014-09-02 01:34:43
阅读次数:
342
webpage字段解释webpage各阶段的字段值变化ROW com.2345.www:http/COL f : fi //fetchIntervalCOL f : ts //fetchTimeid主键,根据网页url生成(格式:reversed domain name...
分类:
其他好文 时间:
2014-09-01 19:07:13
阅读次数:
213
网络爬虫架构在Nutch+Hadoop之上,是一个典型的分布式离线批量处理架构,有非常优异的吞吐量和抓取性能并提供了大量的配置定制选项。由于网络爬虫只负责网络资源的抓取,所以,需要一个分布式搜索引擎,用来对网络...
分类:
其他好文 时间:
2014-08-30 23:13:50
阅读次数:
434
http://blog.fens.me/linux-redis-install/在Ubuntu中安装RedisR利剑NoSQL系列文章,主要介绍通过R语言连接使用nosql数据库。涉及的NoSQL产品,包括Redis,MongoDB,HBase,Hive,Cassandra,Neo4j。希望通过我的...
分类:
其他好文 时间:
2014-08-30 17:43:49
阅读次数:
328
测试案例数据:1.employee表CREATETABLEemployee(numINTNOTNULLPRIMARYKEYAUTO_INCREMENT,d_idINTNOTNULL,nameVARCHAR(20),ageINT,sexVARCHAR(4),homeaddrVARCHAR(50));INSERTINTOemployeeVALUES(NULL,1001,‘张三‘,26,‘男‘,‘北京市海淀区‘);INSERTINTOemployeeVALUES(NULL,1001,..
分类:
数据库 时间:
2014-08-30 02:27:59
阅读次数:
308
LAST_INSERT_ID自动返回最后一个 INSERT 或 UPDATE 操作为 AUTO_INCREMENT列设置的第一个发生的值. 参考这里The ID that was generated is maintained in the server on aper-connection bas...
分类:
数据库 时间:
2014-08-29 19:50:38
阅读次数:
198