码迷,mamicode.com
首页 >  
搜索关键字:Datasets DataFrames    ( 570个结果
Dremel: Interactive Analysis of Web-Scale Datasets 1~6节算法思想部分翻译
Dremel是一个具有可扩展性和交互性,专用于分析只读嵌套数据的查询系统。它本身对多级操作数和柱状数据布局的融合使它得以在秒级的反应时间内对有万亿数量级行记录的表进行集成语句查询。这个系统在谷歌包含数以千计的CPU和PT级的数据量,并有着上千名使用者。这篇论文将会介绍Dremel的体系结构以及其实现,并阐述它如何实现基于MapReduce的计算。本文将呈现一种全新的嵌套式数据柱状存储方式并通过一个基于几千节点的样例系统实验分析性能。...
分类:Web程序   时间:2014-08-08 16:18:16    阅读次数:337
Chart.js报表制作
需要引入Chart.js 报表 发货趋势 var barChartData = { labels : [ "7月20日", "7月21日", "7月22日", "7月23日", "7月24日", "7月25日", "7月26日" ], datasets : [ { fillColor : "rgba(220,220,220,0.5)", ...
分类:Web程序   时间:2014-08-04 14:18:07    阅读次数:360
mahout推荐10-尝试GroupLens数据集
数据集下载地址:http://grouplens.org/datasets/movielens/ 之前用的是100K的,现在需要下载MovieLens 10M,使用里面的ratings.dat前提:因为文件不符合mahout要求的文件输入格式,需要进行转换,但是example里提供了一个解析这个文件...
分类:其他好文   时间:2014-08-04 14:14:47    阅读次数:476
文件相似性判断 -- 超级特征值(super feature)
基于内容的变长分块(CDC)技术,可以用来对文件进行变长分块,而后用来进行重复性检测,广泛用于去重系统中。后来又出现了对相似数据块进行delta压缩,进一步节省存储开销。所以就需要一种高效的相似性检测算法,在论文 WAN Optimized Replication of Backup Datasets Using Stream-Informed Delta Compression 提出的sup...
分类:其他好文   时间:2014-07-29 18:02:42    阅读次数:325
[Python][MachineLeaning]Python Scikit-learn学习笔记1-Datasets&Estimators
Scikit-learn官网:http://scikit-learn.org/stable/index.htmlDatasets标准的数据集格式为一组多维特征向量组成的集合。数据集的标准形状(shape)为二维数组(samples, features),其中samples表示数据集大小,featur...
分类:编程语言   时间:2014-07-16 19:09:46    阅读次数:263
R语言——绘图函数深入学习
利用R自带数据集通过data()函数可以查看R自带数据集。> data()返回以下结果,每一条记录都是一个数据,键入相应的数据名称可以查看具体信息。Data sets in package ¡®datasets¡¯:AirPassengers Monthly Airline ...
分类:其他好文   时间:2014-06-24 12:27:01    阅读次数:193
十分钟了解分布式计算:Spark
Spark是一个通用的分布式内存计算框架,本文主要研讨Spark的核心数据结构RDD,及其在内存上的容错,内容基于论文Zaharia, Matei, et al. "Resilient Distributed Datasets: A Fault-Tolerant Abstraction for In...
分类:其他好文   时间:2014-06-14 20:42:37    阅读次数:326
Deep Learning v0.1 documentation
LICENSE Deep Learning Tutorials Getting Started Datasets Notation A Primer on Supervised Optimization for Deep Learning Theano/Python Tips Classifying MNIST digits using Logistic Regression...
分类:其他好文   时间:2014-06-05 03:05:05    阅读次数:210
Notes on Large-scale Video Classification with Convolutional Neural Networks
Use bigger datasets for CNN in hope of better performance. A new data set for sports video classification: sports-1M.CNN in one frame is about the sam...
分类:Web程序   时间:2014-05-26 19:10:33    阅读次数:597
R语言学习笔记——Base Graphics
做exploratory data annalysis的作业,差点被虐死了,R从头开始,边做边学,最后搞到一点多才弄完,还有一个图怎么画都不对,最后发现是数据读取的时候有问题。用来画图的数据来自:http://archive.ics.uci.edu/ml/datasets/Individual+ho...
分类:其他好文   时间:2014-05-16 07:54:41    阅读次数:406
570条   上一页 1 ... 55 56 57
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!