#coding=utf-8 from math import sqrt from loadMovieLens import loadMovieLensTrain from loadMovieLens import loadMovieLensTest ### 计算pearson相关度 def sim_... ...
分类:
其他好文 时间:
2016-07-13 13:33:47
阅读次数:
158
MapReduce实现基于物品的协同过滤: 实现过程中需要执行多个mapreduce任务。 初始数据: job1: 生成用户对物品喜爱度矩阵 数据:初始数据 map: key=userid value=item:grade reduce: key=userid value=item:grade,it ...
分类:
其他好文 时间:
2016-07-08 19:41:24
阅读次数:
297
1. 基础回顾 特别详细的总结,参考 http://blog.csdn.net/wangzhiqing3/article/details/7446444 矩阵的奇异值分解 SVD 矩阵与向量相乘的结果与特征值,特征向量有关。 数值小的特征值对矩阵-向量相乘的结果贡献小 1)低秩近似 2)特征降维 2 ...
分类:
编程语言 时间:
2016-06-08 15:54:45
阅读次数:
852
推荐系统的分类:
基于应用领域分类:电子商务推荐,社交好友推荐,搜索引擎推荐,信息内容推荐
基于设计思想:基于协同过滤的推荐,基于内容的推荐,基于知识的推荐,混合推荐
基于使用何种数据:基于用户行为数据的推荐,基于用户标签的推荐,基于社交网络数据,基于上下文信息(时间上下文,地点上下文等等)
协同过滤:
协同过滤的基本思想(基于用户):
协同过滤一般是在海量的用户中发掘...
分类:
其他好文 时间:
2016-05-27 12:13:36
阅读次数:
2046
闵氏距离(Minkowski Distance) 当r=1时,曼哈顿距离(Manhatten) 当r=2时,欧氏距离(Euclidean) r=无穷大,上确界距离(Supermum Distance) 皮尔逊相关系数(Pearson CORRELATION Coeffcient),取值[-1,1], ...
分类:
其他好文 时间:
2016-05-18 21:42:54
阅读次数:
155
探索推荐引擎内部的秘密,第 1 部分: 推荐引擎初探 探索推荐引擎内部的秘密,第 2 部分: 深入推荐引擎相关算法 - 协同过滤 探索推荐引擎内部的秘密,第 3 部分: 深入推荐引擎相关算法 - 聚类 ...
分类:
其他好文 时间:
2016-05-13 10:20:29
阅读次数:
136
Amazon.com Recommendations Item-to-Item Collaborative Filtering个人感受:这篇论文首先介绍了历史上的三种算法:传统协同过滤、聚类、基于搜索的算法。第一种方法在计算效率、少量数据上表现欠佳;第二种方法准确率欠佳;第三种方法比较“简单”,因此提出了大量计算在线下的物品-物品的相似记录进行推荐。揣测一下作者的思路,计算量大是因为数据量大,但是...
分类:
其他好文 时间:
2016-05-13 02:44:59
阅读次数:
162
Amazon.com Recommendations Item-to-Item Collaborative Filtering
个人感受:
这篇论文首先介绍了历史上的三种算法:传统协同过滤、聚类、基于搜索的算法。第一种方法在计算效率、少量数据上表现欠佳;第二种方法准确率欠佳;第三种方法比较“简单”,因此提出了大量计算在线下的物品-物品的相似记录进行推荐。
揣测一下作者的思路,计算量大是因为数...
分类:
其他好文 时间:
2016-05-13 02:37:37
阅读次数:
372
浅谈下协同过滤,其中相似性的计算,k邻域算法,slopone算法,以及显式和隐式、userCF和itemCF的区别与局限性...
分类:
其他好文 时间:
2016-05-12 21:22:20
阅读次数:
160