import pandas as pd
import numpy as np
from sklearn import preprocessing
from keras.models import Sequential
from keras.layers.core import Dense, Activation, Dropout
# load training and test datasets...
分类:
编程语言 时间:
2015-08-04 21:12:47
阅读次数:
266
三张表;train_set.csv;test_set.csv;feature.csv。三张表通过object_id关联。
import pandas as pd
import numpy as np
# load training and test datasets
train = pd.read_csv('../input/train_set.csv')
test = pd.re...
分类:
编程语言 时间:
2015-08-02 18:18:32
阅读次数:
229
1大约 sklearn.datasets from sklearn.datasets import load_irisimport numpy as np data = load_iris()data 的属性例如以下:watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5u...
分类:
编程语言 时间:
2015-07-30 13:25:30
阅读次数:
192
Spark SQL是处理结构化数据的Spark模块。它提供了DataFrames这种编程抽象,同时也可以作为分布式SQL查询引擎使用。DataFramesDataFrame是一个带有列名的分布式数据集合。等同于一张关系型数据库中的表或者R/Python中的data frame,不过在底层做了很多优化;我们可以使用结构化数据文件、Hive tables,外部数据库或者RDDS来构造DataFrames...
分类:
数据库 时间:
2015-07-29 17:22:28
阅读次数:
196
最近在看CF的相关论文,《Collaborative Filtering for Implicit Feedback Datasets》思想很好,很容易理解,但是从目标函数
是如何推导出Xu和Yi的更新公式的推导过程却没有很好的描述,所以下面写一下
推导:
首先对Xu求导:
其中Y是item矩阵,n*f维,每一行是一个item_vec,C^u是n*n维的对角矩阵,
对角线上...
分类:
其他好文 时间:
2015-07-27 21:12:10
阅读次数:
410
cd \cd D:\Projects_Face_Detection\Datasets\afwd:dir /b/s/p/w *jpg > Path_Images.txt1.ground_truth矩阵转pts文件shape = phisTr;for i = 1:1345 imgpathlistf...
分类:
其他好文 时间:
2015-07-27 20:53:55
阅读次数:
204
隐性反馈行为数据的协同过滤推荐算法
《Collaborative Filtering for Implicit Feedback Datasets》论文笔记
本文是我阅读《CollaborativeFiltering for Implicit Feedback Datasets》论文的笔记,介绍的是对于隐性反馈行为数据协同过滤算法,采取的是隐语义模型(LFM),求解方式是ALS...
分类:
编程语言 时间:
2015-07-16 22:11:37
阅读次数:
250
1背景介绍现今分布式计算框架像MapReduce和Dryad都提供了高层次的原语,使用户不用操心任务分发和错误容忍,非常容易地编写出并行计算程序。然而这些框架都缺乏对分布式内存的抽象和支持,使其在某些应用场景下不够高效和强大。RDD(Resilient Distributed Datasets弹性分...
分类:
其他好文 时间:
2015-07-15 12:43:05
阅读次数:
164
算法采用数据集为iris(鸢尾花)可以在UCI上下载 http://archive.ics.uci.edu/ml/datasets/Iris数据集介绍:1. sepal length in cm2. sepal width in cm3. petal length in cm4. petal wid...
分类:
编程语言 时间:
2015-07-14 20:03:17
阅读次数:
132
Link-based Classification相关数据集DatasetsDocument Classification Datasets:CiteSeer: The CiteSeer dataset consists of 3312 scientific publications classif...
分类:
其他好文 时间:
2015-07-14 17:41:03
阅读次数:
135