SVD++是基于SVD(Singular Value Decomposition)的一种改进算法。SVD是一种常用的矩阵分解技术,是一种有效的代数特征提取方法。SVD在协同过滤中的主要思路是根据已有的评分情况,分析出评分者对各个因子的喜好程度以及电影包含各个因子的程度,最后再反过来分析数据得出预.....
分类:
编程语言 时间:
2015-05-22 18:37:51
阅读次数:
4869
1、基于user的协同过滤: ????先挖掘出与用户相似兴趣的人群,再从这些相似人群中的人所喜欢的东西但是用户还没喜欢过的内容。? ????举个例子:对于做android开发的初学者来说,他想要知道android开发要...
分类:
其他好文 时间:
2015-05-22 15:22:20
阅读次数:
119
基于内容的推荐的基本推荐思路是:用户喜欢幻想小说,这本书是幻想小说,则用户有可能喜欢这本小说 两方面要求:(1)知道用户的喜好;(2)知道物品的属性 基于内容的推荐相比协同过滤方法(个人观点):协同过滤用到了大量用户的群体行为特征,两个特点,(1)要大量用户,(2)除了用户的行为之外,不需要...
分类:
其他好文 时间:
2015-05-20 00:18:52
阅读次数:
114
本文目的:介绍一种常见推荐算法(用户协同过滤)的使用。应用场景:XXX项目运行一段时间后,系统中将会存在很多视频信息,而通常APP给用户推送的消息(1-3条/每天),那么这就需要我们根据用户的行为特征,进行更为有效的推送。工具介绍:mahout协同过滤算法的使用测试代码:/..
分类:
编程语言 时间:
2015-05-18 21:13:45
阅读次数:
181
基于用户的协同过滤,基于的假设是:喜欢相同物品的用户具有相似性。相同物品越多,用户相似性越大。(有点基于统计的意思) 基于用户的协同过滤推荐机制和基于人口统计学的推荐机制都是计算用户的相似度,并基于“邻居”用户群计算推荐,但它们所不同的是如何计算用户的相似度,基于人口统计学的机制只考虑用户本身的.....
分类:
其他好文 时间:
2015-05-16 20:01:49
阅读次数:
193
第一部分是学习ID3时候积累的。一.以前写的基础知识 1.信息:是用来消除不确定性的度量,信息量的大小,由所消除的不确定性的大小来计量(香农)。 2.由于不确定性是由随机性引起的,所以用概率来描述和计量;熵entropy:源于热力学,是分子混乱程度的度量。 3.X(离散型随机变量)的熵H(...
分类:
其他好文 时间:
2015-05-14 23:45:24
阅读次数:
203
mahout已经提供了item-based cf 算法,但是要想在mahout 算法上修改item-based cf相对来说比较繁琐,比如加入流行度因子降权(降低流行用户与其它用户的相似度)等因素。目前在spark官方没有提供基于item或者user的协同过滤,本文参考了Movie Recommendations and More With Spark文章,写了item-based的协同过滤算法...
分类:
其他好文 时间:
2015-05-14 14:24:29
阅读次数:
1683
我想站在大神肩膀上...貌似是计算所的一个小伙伴... 总结的很好,看得出来有一定的功底.... 不过对于自己看过了的东西,就不愿意再翻看第二遍了。恰好这本书和项亮那本很像,就直接看这本书了。顺便记记笔记,贴到这里,供更多人参考。一. 协同过滤的推荐 基本思想:用户在过去有相同的偏好,e....
分类:
其他好文 时间:
2015-05-14 00:35:41
阅读次数:
116
最近在为找工作准备,于是把原来学习过的算法和还没有接触过的算法一一翻出来总结一番。ALS-WR算法是我比较欣赏的一个推荐算法。能够决解很多问题,比SVD还要好用,就是实现起来有点费劲。然而这个算法却在网上比较难找,出现最多的就是大神fansy1990的博文,他的博文分析的很全面,有大局观。但是在ALS_WR算法上也出现了一定的迷惑性。让初学者不知所云。基于此决定自己总结供大家参考,再次表示抱歉,贴图是自己手写的,博文里编辑公式还是硬伤。...
分类:
编程语言 时间:
2015-05-13 21:53:42
阅读次数:
506