Dremel是一个具有可扩展性和交互性,专用于分析只读嵌套数据的查询系统。它本身对多级操作数和柱状数据布局的融合使它得以在秒级的反应时间内对有万亿数量级行记录的表进行集成语句查询。这个系统在谷歌包含数以千计的CPU和PT级的数据量,并有着上千名使用者。这篇论文将会介绍Dremel的体系结构以及其实现,并阐述它如何实现基于MapReduce的计算。本文将呈现一种全新的嵌套式数据柱状存储方式并通过一个基于几千节点的样例系统实验分析性能。...
分类:
Web程序 时间:
2014-08-08 16:18:16
阅读次数:
337
需要引入Chart.js
报表
发货趋势
var barChartData = {
labels : [ "7月20日", "7月21日", "7月22日", "7月23日", "7月24日", "7月25日",
"7月26日" ],
datasets : [ {
fillColor : "rgba(220,220,220,0.5)",
...
分类:
Web程序 时间:
2014-08-04 14:18:07
阅读次数:
360
数据集下载地址:http://grouplens.org/datasets/movielens/ 之前用的是100K的,现在需要下载MovieLens 10M,使用里面的ratings.dat前提:因为文件不符合mahout要求的文件输入格式,需要进行转换,但是example里提供了一个解析这个文件...
分类:
其他好文 时间:
2014-08-04 14:14:47
阅读次数:
476
基于内容的变长分块(CDC)技术,可以用来对文件进行变长分块,而后用来进行重复性检测,广泛用于去重系统中。后来又出现了对相似数据块进行delta压缩,进一步节省存储开销。所以就需要一种高效的相似性检测算法,在论文 WAN Optimized Replication of Backup Datasets Using Stream-Informed Delta Compression
提出的sup...
分类:
其他好文 时间:
2014-07-29 18:02:42
阅读次数:
325
Scikit-learn官网:http://scikit-learn.org/stable/index.htmlDatasets标准的数据集格式为一组多维特征向量组成的集合。数据集的标准形状(shape)为二维数组(samples, features),其中samples表示数据集大小,featur...
分类:
编程语言 时间:
2014-07-16 19:09:46
阅读次数:
263
利用R自带数据集通过data()函数可以查看R自带数据集。> data()返回以下结果,每一条记录都是一个数据,键入相应的数据名称可以查看具体信息。Data sets in package ¡®datasets¡¯:AirPassengers Monthly Airline ...
分类:
其他好文 时间:
2014-06-24 12:27:01
阅读次数:
193
Spark是一个通用的分布式内存计算框架,本文主要研讨Spark的核心数据结构RDD,及其在内存上的容错,内容基于论文Zaharia, Matei, et al. "Resilient Distributed Datasets: A Fault-Tolerant Abstraction for In...
分类:
其他好文 时间:
2014-06-14 20:42:37
阅读次数:
326
LICENSE
Deep Learning Tutorials
Getting Started
Datasets
Notation
A Primer on Supervised Optimization for Deep Learning
Theano/Python Tips
Classifying MNIST digits using Logistic Regression...
分类:
其他好文 时间:
2014-06-05 03:05:05
阅读次数:
210
Use bigger datasets for CNN in hope of better
performance. A new data set for sports video classification: sports-1M.CNN in
one frame is about the sam...
分类:
Web程序 时间:
2014-05-26 19:10:33
阅读次数:
597
做exploratory data
annalysis的作业,差点被虐死了,R从头开始,边做边学,最后搞到一点多才弄完,还有一个图怎么画都不对,最后发现是数据读取的时候有问题。用来画图的数据来自:http://archive.ics.uci.edu/ml/datasets/Individual+ho...
分类:
其他好文 时间:
2014-05-16 07:54:41
阅读次数:
406