webpage字段解释webpage各阶段的字段值变化ROW com.2345.www:http/COL f : fi //fetchIntervalCOL f : ts //fetchTimeid主键,根据网页url生成(格式:reversed domain name...
分类:
其他好文 时间:
2014-09-01 19:07:13
阅读次数:
213
继续来说编辑器的需求, 前面介绍了拖拽创建节点、以及连线的方法,并加入到了其后的 Qunee 类库,实际应用中需要更多功能,Qunee 的拓扑图编辑器也在逐渐完善,一方面增加多种编辑交互,一方面提供数据导入导出,...
分类:
Web程序 时间:
2014-09-01 10:55:23
阅读次数:
276
本周接手了一个Cassandra系统的维护工作,有一项是需要将应用方的数据导入我们维护的Cassandra集群,并且为应用方提供HTTP的方式访问服务。这是我第一次接触KV系统,原来只是走马观花似的看过KV啊,NoSQL啊。但是实际上没有实际的使用经验。经过两天的学习和接手,终于搞明白了在生产环境中的使用方式。在此简要的笔记一下。本文主要包括的内容有:
Cassandra的简介,
Cassandra的相关CLI
Cassandra的Python API,并且给出一个批量导入数据的例子。...
分类:
其他好文 时间:
2014-08-31 11:54:01
阅读次数:
216
网络爬虫架构在Nutch+Hadoop之上,是一个典型的分布式离线批量处理架构,有非常优异的吞吐量和抓取性能并提供了大量的配置定制选项。由于网络爬虫只负责网络资源的抓取,所以,需要一个分布式搜索引擎,用来对网络...
分类:
其他好文 时间:
2014-08-30 23:13:50
阅读次数:
434
http://blog.fens.me/linux-redis-install/在Ubuntu中安装RedisR利剑NoSQL系列文章,主要介绍通过R语言连接使用nosql数据库。涉及的NoSQL产品,包括Redis,MongoDB,HBase,Hive,Cassandra,Neo4j。希望通过我的...
分类:
其他好文 时间:
2014-08-30 17:43:49
阅读次数:
328
最近需要把SqlServer2008 的数据库导入sqlserver2005 中。直接备份还原肯定不行。后来想到可以生成脚本执行sql语句,并选择数据可以一同进行执行。点击右键---》任务---》生成脚本---》下一步选择“编写数据脚本”为 true 。不同版本的sqlserver 这块的叫法不一样...
分类:
数据库 时间:
2014-08-29 18:01:38
阅读次数:
258
什么是hbasehbase是一个高可靠性、高性能、高吞吐量、面向列、可伸缩的分布式数据库,设计的最初目的是用来解决关系型数据库在处理海量数据时的局限性。hbase特性海量数据(TB\PB)高吞吐量高性能(海量数据中实现高效随机读取)可伸缩能够同时处理结构化和非结构化的数据不需要拥有传统数据库所具备的...
分类:
其他好文 时间:
2014-08-29 17:58:58
阅读次数:
236
oracle11G当你用久了之后,发现磁盘空间会减少,并且没有对数据导入数据,过一段时间之后你会发现磁盘空间已经没有空间了,后来我找到原因是oracle11G会自动备份数据库,备份的目录在:F:\oracle11g\product\11.2.0\dbhome_3\database,你可以找到改目录下,将其删了就可以了
分类:
数据库 时间:
2014-08-29 16:19:48
阅读次数:
239
1、region热点:
开始会不断往一个region写,可以预划分region
在rowkey加哈希前缀 对region server数量取余
2、memstore提高写性能,blockcache提高读性能,看需求调整
3、使用bloomfilter,如果大多是scan顺序读,可将block设大些,默认块大小是64K,可以设为128
4、设计好rowkey
5、关闭major comp...
分类:
其他好文 时间:
2014-08-28 16:58:40
阅读次数:
176