《Resilient Distributed Datasets: A Fault-Tolerant Abstraction for In-Memory Cluster Computing》论文阅读笔记。 介绍了基于弹性分布式数据集(RDD)的分布式计算模型,并介绍了该模型的实现Spark平台。
分类:
其他好文 时间:
2015-05-27 15:40:01
阅读次数:
530
Background Subtraction Datasets - Article(11 Datasets)1、Wallflower Test Images Sequences(J.Krumm, Microsoft Research, USA) (7 videos, 1 Ground Truth i...
分类:
其他好文 时间:
2015-05-18 14:20:56
阅读次数:
198
首先搭建基本环境,假设已经有Python运行环境。然后需要装上一些通用的基本库,如numpy, scipy用以数值计算,pandas用以数据分析,matplotlib/Bokeh/Seaborn用来数据可视化。再按需装上数据获取的库,如Tushare(http://pythonhosted.org/tushare/),Quandl(https://www.quandl.com/)等。网上还有很多可供分析的免费数据集(http://www.kdnuggets.com/datasets/index.html)。...
分类:
编程语言 时间:
2015-05-17 22:00:37
阅读次数:
495
转载自http://stats.stackexchange.com/questions/12392/how-to-compare-two-datasets-with-q-q-plot-using-ggplot2感谢csgillespie的答案qqplot是可以直观反应两组数字是否属于同一分布的作图。...
分类:
其他好文 时间:
2015-05-12 22:42:27
阅读次数:
419
Spark学习笔记之SparkRDD一、 基本概念RDD(resilient distributed datasets)弹性分布式数据集。来自于两方面① 内存集合和外部存储系统② 通过转换来自于其他RDD,如map,filter等2.创建操作(creation operation):RDD的创建由S...
分类:
其他好文 时间:
2015-04-18 20:29:12
阅读次数:
179
Merging DataAdding ColumnsTo merge two data frames (datasets) horizontally, use the merge function. In most cases, you join two data frames by one or ...
分类:
编程语言 时间:
2015-04-17 22:05:43
阅读次数:
239
下载
libsvm库下载:http://www.csie.ntu.edu.tw/~cjlin/libsvm/
数据集下载:http://www.csie.ntu.edu.tw/~cjlin/libsvmtools/datasets/
配置设置path:File->set path ->add with subfolders->加入libsvm-3.x文件夹的路径使用>> [label instanc...
分类:
其他好文 时间:
2015-04-11 17:55:30
阅读次数:
165
1. Some benchmark eye movement datasets over still images often used to evaluate visual attention models.2009Kienzle165Center-Surround Patterns Emerge...
分类:
其他好文 时间:
2015-04-09 19:30:24
阅读次数:
299
机器学习Machine Learning - Andrew NG
courses学习笔记
Large Scale Machine Learning大规模机器学习
Learning With Large Datasets大数据集学习
Stochastic Gradient Descent随机梯度下降
Mini-Batch Gradient Descent迷你批处理梯度下降...
分类:
系统相关 时间:
2015-04-06 20:20:23
阅读次数:
220
from matplotlib import pyplot as pltfrom sklearn.datasets import load_irisimport numpy as npdata=load_iris()feature_names=data['featrue_names']target=...
分类:
Windows程序 时间:
2015-03-07 22:37:34
阅读次数:
1231