机器学习(十三)——机器学习中的矩阵方法(3)病态矩阵、协同过滤的ALS算法(1)
分类:
编程语言 时间:
2016-12-12 09:56:46
阅读次数:
425
理论原理部分可以看这一篇:http://www.cnblogs.com/charlesblc/p/6109551.html 这里是实战部分。参考了 http://www.cnblogs.com/shishanyuan/p/4747778.html 采用了三个案例,分别对应聚类、回归和协同过滤的算法。 ...
分类:
其他好文 时间:
2016-12-11 12:13:35
阅读次数:
170
搜索推荐,主要有以下几种形式:一、根据人口统计学推荐:此推荐方式需要建立用户模型,并且需要获取用户的具体信息,然后根据矩阵运算,计算相似度,此方式最大缺陷是获取用户的隐私,应用不多; 二、基于内容的推荐:根据特定用户的历史数据,推荐出相似的产品。缺点是需要建立item model,比较费时。 三、基 ...
分类:
其他好文 时间:
2016-11-28 23:46:45
阅读次数:
790
1.平均值 1.1 全局平均值 1.2 用户评分平均值 1.3 物品评分平均值 1.4 用户分类对物品分类的平均值 分类方法: 1.4.1 平均值分类 1.4.2 活跃度/流行度分类 2.基于邻域的方法 2.1 基于用户的协同过滤 2.... ...
分类:
其他好文 时间:
2016-11-24 09:13:08
阅读次数:
267
本文试验前期准备: Sparsity: 6.30% 数据稀疏度:6.3% 分别计算user相似性和item相似性,并输出item相似性矩阵的前4行 预测评分,predict_fast_simple使用NumPy数学函数,计算更块 1 loop, best of 3: 1min 52s per loo ...
分类:
其他好文 时间:
2016-11-09 11:10:31
阅读次数:
498
在新手接触推荐系统这个领域时,遇到第一个理解起来比较困难的就是协同过滤法。那么如果这时候百度的话,得到最多的是奇异值分解法,即(SVD)。SVD的作用大致是将一个矩阵分解为三个矩阵相乘的形式。如果运用在推荐系统中,首先我们将我们的训练集表示成矩阵的形式,这里我们以movielen数据集为例。这个数据 ...
分类:
其他好文 时间:
2016-10-25 02:01:44
阅读次数:
1266
现在假设你有100万个用户,每次对一个用户进行一次推荐时,需要计算100万次距离。如果每一秒需要进行多次推荐的话计算次数会十分巨大,系统会很慢。正式的说话是,基于令居的推荐系统的主要缺点是延迟性太差。 1 )基于用户的过滤的两个主要问题: 1.扩展性问题: 随着用户数量的增大,计算量会增大,基于用户 ...
分类:
其他好文 时间:
2016-10-23 20:07:34
阅读次数:
271
显式评级:显式评级是指用户显式的给出物品的评价结果,例如直接打分 显式评级存在的问题: 1 用户大多具有懒惰性,不愿意对物品进行评级:例如大部分人对购买的物品不愿意给出评价,这体现了一种用户懒惰行为 2 用户可能撒谎或者只给出部分信息:如果某人克服了懒惰性,真的对物品进行评分,该用户也可能撒谎 3 ...
分类:
其他好文 时间:
2016-10-23 17:28:33
阅读次数:
167
承接上文:
http://blog.csdn.net/wangqi880/article/details/52875524
对了,每台机子的防火墙要关闭哈,不然spark集群启动不起来
前一次,...
分类:
编程语言 时间:
2016-10-22 12:25:47
阅读次数:
405
推荐系统的目标是向用户推荐他没有体验过的那些物品,没体验过的物品有很多,推荐哪一个呢,这需要预测用户对某个物品的评分,评分高的物品被推荐给用户,所以推荐系统的本质其实是一个预测问题。协同过滤会先算用户的相似度,然后把相似用户给物品的评分乘以两者的相似度,作为目标用户对物品的预测评分,预测评分大的加入 ...
分类:
其他好文 时间:
2016-10-17 23:08:36
阅读次数:
153