码迷,mamicode.com
首页 >  
搜索关键字:Datasets DataFrames    ( 570个结果
machine learning in coding(python):根据关键字合并feature,删除无用feature,转化为numpy数组
import pandas as pd import numpy as np from sklearn import preprocessing from keras.models import Sequential from keras.layers.core import Dense, Activation, Dropout # load training and test datasets...
分类:编程语言   时间:2015-08-04 21:12:47    阅读次数:266
machine learning in python:根据关键字合并多个表(构建组合feature)
三张表;train_set.csv;test_set.csv;feature.csv。三张表通过object_id关联。 import pandas as pd import numpy as np # load training and test datasets train = pd.read_csv('../input/train_set.csv') test = pd.re...
分类:编程语言   时间:2015-08-02 18:18:32    阅读次数:229
machine learn in python 第二章2.1.1
1大约 sklearn.datasets from sklearn.datasets import load_irisimport numpy as np data = load_iris()data 的属性例如以下:watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5u...
分类:编程语言   时间:2015-07-30 13:25:30    阅读次数:192
Spark SQL and DataFrame Guide(1.4.1)——之DataFrames
Spark SQL是处理结构化数据的Spark模块。它提供了DataFrames这种编程抽象,同时也可以作为分布式SQL查询引擎使用。DataFramesDataFrame是一个带有列名的分布式数据集合。等同于一张关系型数据库中的表或者R/Python中的data frame,不过在底层做了很多优化;我们可以使用结构化数据文件、Hive tables,外部数据库或者RDDS来构造DataFrames...
分类:数据库   时间:2015-07-29 17:22:28    阅读次数:196
Alternating Least Squares(ASL) 的数学推导
最近在看CF的相关论文,《Collaborative Filtering for Implicit Feedback Datasets》思想很好,很容易理解,但是从目标函数 是如何推导出Xu和Yi的更新公式的推导过程却没有很好的描述,所以下面写一下 推导: 首先对Xu求导: 其中Y是item矩阵,n*f维,每一行是一个item_vec,C^u是n*n维的对角矩阵, 对角线上...
分类:其他好文   时间:2015-07-27 21:12:10    阅读次数:410
批量处理_cmd_matlab
cd \cd D:\Projects_Face_Detection\Datasets\afwd:dir /b/s/p/w *jpg > Path_Images.txt1.ground_truth矩阵转pts文件shape = phisTr;for i = 1:1345 imgpathlistf...
分类:其他好文   时间:2015-07-27 20:53:55    阅读次数:204
隐性反馈行为数据的协同过滤推荐算法
隐性反馈行为数据的协同过滤推荐算法 《Collaborative Filtering for Implicit Feedback Datasets》论文笔记 本文是我阅读《CollaborativeFiltering for Implicit Feedback Datasets》论文的笔记,介绍的是对于隐性反馈行为数据协同过滤算法,采取的是隐语义模型(LFM),求解方式是ALS...
分类:编程语言   时间:2015-07-16 22:11:37    阅读次数:250
Spark分布式计算和RDD模型研究
1背景介绍现今分布式计算框架像MapReduce和Dryad都提供了高层次的原语,使用户不用操心任务分发和错误容忍,非常容易地编写出并行计算程序。然而这些框架都缺乏对分布式内存的抽象和支持,使其在某些应用场景下不够高效和强大。RDD(Resilient Distributed Datasets弹性分...
分类:其他好文   时间:2015-07-15 12:43:05    阅读次数:164
数据挖掘聚类算法--Kmeans
算法采用数据集为iris(鸢尾花)可以在UCI上下载 http://archive.ics.uci.edu/ml/datasets/Iris数据集介绍:1. sepal length in cm2. sepal width in cm3. petal length in cm4. petal wid...
分类:编程语言   时间:2015-07-14 20:03:17    阅读次数:132
Link-based Classification相关数据集
Link-based Classification相关数据集DatasetsDocument Classification Datasets:CiteSeer: The CiteSeer dataset consists of 3312 scientific publications classif...
分类:其他好文   时间:2015-07-14 17:41:03    阅读次数:135
570条   上一页 1 ... 50 51 52 53 54 ... 57 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!