近期读的几篇关于Cassandra 大数据分析的几篇文章,记录下:Big Analytics with R, Cassandra, and Hive中文翻译:http://www.csdn.net/article/2012-05-20/2805705Cassandra联姻Spark 大数据分析将迎来...
分类:
其他好文 时间:
2014-12-15 17:00:04
阅读次数:
192
在Cassandra的 system log中看到如下的log:INFO 07:17:18 Enqueuing flush of Standard1: 701845360 (33%) on-heap, 0 (0%) off-heapINFO 07:17:19 Writing Memtable-S.....
分类:
其他好文 时间:
2014-12-11 17:03:42
阅读次数:
217
1,官方文档,基本类型数据查询语言文档:http://www.datastax.com/documentation/cql/3.1/cql/cql_reference/update_r.htmlcql 支持的数据类型:相对于 MySQL,有几个类型比较有意思,uuid类型,map,list,set类型,这个优化关联查询,直接将List存入一条记录。CQL TypeConstantsDescript...
分类:
其他好文 时间:
2014-11-29 16:02:33
阅读次数:
242
Hadoop家族系列文章, 主要介绍Hadoop家族产品,常用的项目包括Hadoop, Hive, Pig, HBase, Sqoop, Mahout, Zookeeper, Avro, Ambari, Chukwa,新增加的项目包括,YARN, Hcatalog, Oozie, Cassandra...
分类:
其他好文 时间:
2014-11-26 14:09:05
阅读次数:
352
本文就spark-cassandra-connector的一些实现细节进行探讨,主要集中于如何快速将大量的数据从cassandra中读取到本地内存或磁盘。
分类:
Web程序 时间:
2014-11-17 22:33:25
阅读次数:
492
Facebook Bigdata - Presto升级到0.80。本次升级主要是支持Hive ORC读取器,提供了Cassandra 2.1.0驱动支持,还提供了对大数据查询的试验性支持。...
分类:
其他好文 时间:
2014-11-05 14:49:30
阅读次数:
255
http://zh.wikipedia.org/wiki/CassandraApache Cassandra是一套开源分布式NoSQL数据库系统。它最初由Facebook开发,用于储存收件箱等简单格式数据,集Google BigTable的数据模型与Amazon Dynamo的完全分布式的架构于一身...
分类:
其他好文 时间:
2014-11-05 10:51:22
阅读次数:
168
吞吐量,延迟,这是一对矛盾,吞吐量越大,延迟越低,性能越好。==================================================================总结:HBase 适合各种场景。Cassandra并发插入10W条数据就不动了,适合读写分离的场景,写入场景...
分类:
数据库 时间:
2014-11-03 14:24:47
阅读次数:
217
针对的时Cassandra 2.0 数据库
Java本地客户端访问Cassandra,首先建立Java工程,使用Maven进行管理。
引入依赖:
com.datastax.cassandra
cassandra-driver-core
2.1.0
1. 类似Elasticsearch的方式,现在客户端构建一个集群对象:
Cluster cluster = Cl...
分类:
数据库 时间:
2014-10-24 18:53:52
阅读次数:
287
“Ad-hoc analysis over Cassandra data with Facebook Presto”一文,对Cassandra+Presto
结合实现大数据即席分析进行了介绍。Presto是为满足交互式即席查询需求而优化的分布式SQL查询引擎。它支持标准ANSI SQL,包括复杂查询,聚合,连接和窗口函数。
Cassandra以前缺少交互式即席查询功能,甚至在CQL中不支持聚合函数。因为这个原因,Cassandra在作为数据库使用时经常被混淆。分析Cassandra中的数据有下边两个框架:
...
分类:
Web程序 时间:
2014-10-10 20:13:04
阅读次数:
666