Spark学习笔记之SparkRDD一、 基本概念RDD(resilient distributed datasets)弹性分布式数据集。来自于两方面① 内存集合和外部存储系统② 通过转换来自于其他RDD,如map,filter等2.创建操作(creation operation):RDD的创建由S...
分类:
其他好文 时间:
2015-04-18 20:29:12
阅读次数:
179
Merging DataAdding ColumnsTo merge two data frames (datasets) horizontally, use the merge function. In most cases, you join two data frames by one or ...
分类:
编程语言 时间:
2015-04-17 22:05:43
阅读次数:
239
下载
libsvm库下载:http://www.csie.ntu.edu.tw/~cjlin/libsvm/
数据集下载:http://www.csie.ntu.edu.tw/~cjlin/libsvmtools/datasets/
配置设置path:File->set path ->add with subfolders->加入libsvm-3.x文件夹的路径使用>> [label instanc...
分类:
其他好文 时间:
2015-04-11 17:55:30
阅读次数:
165
1. Some benchmark eye movement datasets over still images often used to evaluate visual attention models.2009Kienzle165Center-Surround Patterns Emerge...
分类:
其他好文 时间:
2015-04-09 19:30:24
阅读次数:
299
机器学习Machine Learning - Andrew NG
courses学习笔记
Large Scale Machine Learning大规模机器学习
Learning With Large Datasets大数据集学习
Stochastic Gradient Descent随机梯度下降
Mini-Batch Gradient Descent迷你批处理梯度下降...
分类:
系统相关 时间:
2015-04-06 20:20:23
阅读次数:
220
from matplotlib import pyplot as pltfrom sklearn.datasets import load_irisimport numpy as npdata=load_iris()feature_names=data['featrue_names']target=...
分类:
Windows程序 时间:
2015-03-07 22:37:34
阅读次数:
1231
本栏目(数据挖掘)下海量数据挖掘专题是个人对Coursera公开课海量数据挖掘(2015)的学习心得与笔记。所有内容均来自Coursera公开课Mining Massive Datasets中Jure Leskovec, Anand Rajaraman以及Jeff Ullman老师的讲解。(https://class.coursera.org/mmds-002/lecture)
第1讲---...
分类:
其他好文 时间:
2015-02-16 06:50:14
阅读次数:
373
DescriptionOften when manipulating datasets with similar structures, you need to copy the records from one dataset to another.E.g. you may have fetche...
分类:
其他好文 时间:
2015-02-03 12:58:51
阅读次数:
249
机器学习的来源和用例:
Machine Learning
- Grew out of work in AI
- New capability for computers
Examples:
- Database mining
Large datasets from growth of automation/web.
E.g., Web click data, medical re...
分类:
系统相关 时间:
2015-01-24 21:27:36
阅读次数:
331
调用python的sklearn实现Logistic Reression算法
先说如何实现,其中的导入数据库和类、方法的关系,之前不是很清楚,现在知道了。。。
from numpy import *
from sklearn.datasets import load_iris # import datasets
# load the dataset...
分类:
编程语言 时间:
2015-01-21 20:14:19
阅读次数:
1118