注意:1、代码中的注释请不要放在源程序中运行,会报错。2、代码中的数据集来源于http://archive.ics.uci.edu/ml/datasets/Car+Evaluation3、对于朴素贝叶斯的原理,可以查看我的前面的博客#Author:WenxiangCui
#Date:2015/9/11
#Function:AclassifierwhichusingnaiveBayesiana..
分类:
编程语言 时间:
2015-09-14 00:44:27
阅读次数:
234
RDD, Resilient Distributed Dataset,弹性分布式数据集, 是Spark的核心概念。对于RDD的原理性的知识,可以参阅Resilient Distributed Datasets: A Fault-Tolerant Abstraction for In-Memory C...
分类:
其他好文 时间:
2015-09-06 12:47:10
阅读次数:
169
MovieLens 100k数据包含有100,000条用户与电影的相关数据。
首先下载并解压数据:wget http://files.grouplens.org/datasets/movielens/ml-100k.zip
unzip ml-100k.zip
cd ml-100k
#用户文件(ID,年龄,性别,职业,邮编)
zhf@ubuntu:~/Downloads/ml-100k$ head...
分类:
其他好文 时间:
2015-08-30 21:25:57
阅读次数:
250
1、学习Spark必须要深入理解RDD编程模型。为什么呢?
RDD是Spark抽象的基石,整个Spark的编程都是基于对RDD的操作完成的。RDD(弹性分布式数据集,Resilient Distributed Datasets),其特性是只读的、可分区、容错的的数据集合;所谓弹性,指内存不够时,可以与磁盘进行交换(Spark是基于内存的),上述是Spark快的一个原因。Spark快的另...
分类:
其他好文 时间:
2015-08-26 18:00:53
阅读次数:
368
本文转载:http://shiyanjun.cn/archives/744.html摘要本文提出了分布式内存抽象的概念——弹性分布式数据集(RDD,Resilient Distributed Datasets),它具备像MapReduce等数据流模型的容错特性,并且允许开发人员在大型集群上执行基于内...
分类:
其他好文 时间:
2015-08-09 13:52:01
阅读次数:
144
import pandas as pd
import numpy as np
from sklearn import preprocessing
from keras.models import Sequential
from keras.layers.core import Dense, Activation, Dropout
# load training and test datasets...
分类:
编程语言 时间:
2015-08-04 21:12:47
阅读次数:
266
三张表;train_set.csv;test_set.csv;feature.csv。三张表通过object_id关联。
import pandas as pd
import numpy as np
# load training and test datasets
train = pd.read_csv('../input/train_set.csv')
test = pd.re...
分类:
编程语言 时间:
2015-08-02 18:18:32
阅读次数:
229
1大约 sklearn.datasets from sklearn.datasets import load_irisimport numpy as np data = load_iris()data 的属性例如以下:watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5u...
分类:
编程语言 时间:
2015-07-30 13:25:30
阅读次数:
192
最近在看CF的相关论文,《Collaborative Filtering for Implicit Feedback Datasets》思想很好,很容易理解,但是从目标函数
是如何推导出Xu和Yi的更新公式的推导过程却没有很好的描述,所以下面写一下
推导:
首先对Xu求导:
其中Y是item矩阵,n*f维,每一行是一个item_vec,C^u是n*n维的对角矩阵,
对角线上...
分类:
其他好文 时间:
2015-07-27 21:12:10
阅读次数:
410
cd \cd D:\Projects_Face_Detection\Datasets\afwd:dir /b/s/p/w *jpg > Path_Images.txt1.ground_truth矩阵转pts文件shape = phisTr;for i = 1:1345 imgpathlistf...
分类:
其他好文 时间:
2015-07-27 20:53:55
阅读次数:
204