在现今的推荐技术和算法中,最被大家广泛认可和采用的就是基于协同过滤的推荐方法。本文将带你深入了解协同过滤的秘密。下面直接进入正题 1 什么是协同过滤 协同过滤是利用集体智慧的一个典型方法。要理解什么是协同过滤 (Collaborative Filtering, 简称 CF),首先想一个简单的问题,如...
分类:
其他好文 时间:
2016-01-08 20:11:03
阅读次数:
148
1、基于用户的协同过滤算法步骤: 1.1找到和目标用户兴趣相似的用户集合 1.2 找到这个集合中的用户喜欢的,且目标用户没有听过的物品推荐给目标用户步骤1的关键是计算2用户的兴趣相似度。2、基于物品的协同过滤算法 2.1计算物品之间的相似度 2.2根据物品的相似度和用户的历史行为给用户生成推...
分类:
编程语言 时间:
2015-12-07 12:27:24
阅读次数:
207
《Spark快速大数据分析》11.5.4协同过滤与推荐协同过滤是一种根据用户对各种产品的交互与评分来推荐新产品的推荐系统技术。协同过滤引入的地方就在于它只需要输入一系列用户/产品的交互记录;无论是显式的交互(例如在购物网站上进行评分)还是隐式的(例如用户访问了一个产品的页面但是没有对产品评分)交互皆...
分类:
其他好文 时间:
2015-12-04 00:50:53
阅读次数:
2842
1、下一阶段需要改进完善的功能 话题模块(分类参考Citeulike论文网站),文章/计划的删除功能2、下一阶段新增的功能 1)推荐模块(冷启动问题,拟爬取部分豆瓣数据,部分伪专家数据(我们团队), 2)基于ItemCF的协同过滤), 3)聊天模块(bmob) , 4)评论功能(Star,...
分类:
其他好文 时间:
2015-11-26 22:56:53
阅读次数:
186
用户电影评分数据集下载http://grouplens.org/datasets/movielens/1)Item-Based,非个性化的,每个人看到的都一样2)User-Based,个性化的,每个人看到的不一样对用户的行为分析得到用户的喜好后,可以根据用户的喜好计算相似用户和物品,然后可以基于相似用户或物品进行推荐。这..
分类:
编程语言 时间:
2015-11-05 19:08:06
阅读次数:
669
1.推荐系统中的算法: 协同过滤: 基于用户 user-cf 基于内容 item –cf slop one 关联规则 (Apriori 算法,啤酒与尿布) 2.slope one 算法 slope one 算法是基于不同物品之间的评分差的线性算法,预测用户对物品评分的个性化算法。slope one ...
分类:
其他好文 时间:
2015-10-17 16:16:31
阅读次数:
941
本文将按照作者学习的顺序,对推荐算法进行一个综述性的介绍,可能会有些跳跃性。一则供自己后续不时翻阅,二则分享给读者。传播知识是一件很快乐的事情。 ? ? 1. 基于相似度的方法(协同过滤) ? ? ...
分类:
编程语言 时间:
2015-10-08 16:42:27
阅读次数:
256
Mahout中对协同过滤算法进行了封装,看一个简单的基于用户的协同过滤算法。基于用户:通过用户对物品的偏好程度来计算出用户的在喜好上的近邻,从而根据近邻的喜好推测出用户的喜好并推荐。图片来源程序中用到的数据都存在MySQL数据库中,计算结果也存在MySQL中的对应用户表中。package com.m...
分类:
编程语言 时间:
2015-10-05 23:24:35
阅读次数:
362
1、动机2、基于内容的分类器3、python实现一、动机在前面的文章中介绍了基于用户和基于物品的协同过滤推荐方法,其实无论是基于用户还是基于物品,都是通过群体效应来进行推荐,因为衡量相似度的向量都是基于一定群体用户的评分,所以推荐出来的物品都是热门的流行的物品,对于一些冷门物品可能就无法收到亲睐。而...
分类:
其他好文 时间:
2015-10-05 11:34:11
阅读次数:
336
主要内容:1、k近邻2、python实现1、什么是k近邻(KNN)在入门-1中,简单地实现了基于用户协同过滤的最近邻算法,所谓最近邻,就是找到距离最近或最相似的用户,将他的物品推荐出来。而这里,k近邻(K Nearest Neighbor)的意思就是,找出最近或最相似的k个用户,将他们的评分(相似度...
分类:
其他好文 时间:
2015-10-02 11:18:36
阅读次数:
191