码迷,mamicode.com
首页 >  
搜索关键字:datasets    ( 544个结果
朴素贝叶斯算法的Python实现
注意:1、代码中的注释请不要放在源程序中运行,会报错。2、代码中的数据集来源于http://archive.ics.uci.edu/ml/datasets/Car+Evaluation3、对于朴素贝叶斯的原理,可以查看我的前面的博客#Author:WenxiangCui #Date:2015/9/11 #Function:AclassifierwhichusingnaiveBayesiana..
分类:编程语言   时间:2015-09-14 00:44:27    阅读次数:234
关于RDD
RDD, Resilient Distributed Dataset,弹性分布式数据集, 是Spark的核心概念。对于RDD的原理性的知识,可以参阅Resilient Distributed Datasets: A Fault-Tolerant Abstraction for In-Memory C...
分类:其他好文   时间:2015-09-06 12:47:10    阅读次数:169
使用Spark和Zeppelin探索movie-lens数据
MovieLens 100k数据包含有100,000条用户与电影的相关数据。 首先下载并解压数据:wget http://files.grouplens.org/datasets/movielens/ml-100k.zip unzip ml-100k.zip cd ml-100k #用户文件(ID,年龄,性别,职业,邮编) zhf@ubuntu:~/Downloads/ml-100k$ head...
分类:其他好文   时间:2015-08-30 21:25:57    阅读次数:250
Spark问题笔记2
1、学习Spark必须要深入理解RDD编程模型。为什么呢?      RDD是Spark抽象的基石,整个Spark的编程都是基于对RDD的操作完成的。RDD(弹性分布式数据集,Resilient Distributed Datasets),其特性是只读的、可分区、容错的的数据集合;所谓弹性,指内存不够时,可以与磁盘进行交换(Spark是基于内存的),上述是Spark快的一个原因。Spark快的另...
分类:其他好文   时间:2015-08-26 18:00:53    阅读次数:368
RDD:基于内存的集群计算容错抽象
本文转载:http://shiyanjun.cn/archives/744.html摘要本文提出了分布式内存抽象的概念——弹性分布式数据集(RDD,Resilient Distributed Datasets),它具备像MapReduce等数据流模型的容错特性,并且允许开发人员在大型集群上执行基于内...
分类:其他好文   时间:2015-08-09 13:52:01    阅读次数:144
machine learning in coding(python):根据关键字合并feature,删除无用feature,转化为numpy数组
import pandas as pd import numpy as np from sklearn import preprocessing from keras.models import Sequential from keras.layers.core import Dense, Activation, Dropout # load training and test datasets...
分类:编程语言   时间:2015-08-04 21:12:47    阅读次数:266
machine learning in python:根据关键字合并多个表(构建组合feature)
三张表;train_set.csv;test_set.csv;feature.csv。三张表通过object_id关联。 import pandas as pd import numpy as np # load training and test datasets train = pd.read_csv('../input/train_set.csv') test = pd.re...
分类:编程语言   时间:2015-08-02 18:18:32    阅读次数:229
machine learn in python 第二章2.1.1
1大约 sklearn.datasets from sklearn.datasets import load_irisimport numpy as np data = load_iris()data 的属性例如以下:watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5u...
分类:编程语言   时间:2015-07-30 13:25:30    阅读次数:192
Alternating Least Squares(ASL) 的数学推导
最近在看CF的相关论文,《Collaborative Filtering for Implicit Feedback Datasets》思想很好,很容易理解,但是从目标函数 是如何推导出Xu和Yi的更新公式的推导过程却没有很好的描述,所以下面写一下 推导: 首先对Xu求导: 其中Y是item矩阵,n*f维,每一行是一个item_vec,C^u是n*n维的对角矩阵, 对角线上...
分类:其他好文   时间:2015-07-27 21:12:10    阅读次数:410
批量处理_cmd_matlab
cd \cd D:\Projects_Face_Detection\Datasets\afwd:dir /b/s/p/w *jpg > Path_Images.txt1.ground_truth矩阵转pts文件shape = phisTr;for i = 1:1345 imgpathlistf...
分类:其他好文   时间:2015-07-27 20:53:55    阅读次数:204
544条   上一页 1 ... 47 48 49 50 51 ... 55 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!