本文引自http://blog.csdn.net/fwing/article/details/4942886现在的推荐系统特别火啊。做得最好的应该是Amazon了。上面是Amazon的图书推荐。用的就是著名的协同过滤(Collaborative filtering)算法。我们用一个简单的例子来说明。...
分类:
其他好文 时间:
2014-12-16 22:20:37
阅读次数:
188
协同过滤是当今最流行的推荐系统。其流行的最重要原因是:有实际环境作为改进的基准,而且用于分析生成推荐的数据结构(用户物品评分矩阵),非常简单。其他算法,就不会这么简单,比如通过会话交互的推荐应用会在会谈中询问用户的偏好,并且还会融入一些额外的领域知识。
协同过滤不可能应用于每个领域:例如一个没有购买历史的汽车销售系统,或需要更多用户偏好细节的系统。同样,协同过滤技术要求用户社区处于某个特定规模,这意味着即使在书籍和电影领率,如果没有足够的用户或评分数据,也无法应用这些技术。...
分类:
其他好文 时间:
2014-12-14 22:46:00
阅读次数:
282
基于用户的协同过滤算法-参考《推荐系统实践》一书,作者:项亮 1 import random 2 import math 3 class UserBasedCF: 4 def __init__(self,datafile = None): 5 self.datafi...
分类:
编程语言 时间:
2014-12-11 12:02:25
阅读次数:
250
前两章的协同过滤和就内容的推荐都建立在“大量数据”的基础上,运用概率方法来进行计算和预测。不过,在现实生活中,有些物品,如:汽车、房屋、计算机,用户不会频繁的消费。如何在这种情况下对用户进行推荐?
这种case,在现实生活中很常见的就是在淘宝上面用general的query来搜索一些大宗物品,如:相机、电视、空调、等等。这时候淘宝除了给出一些结果,还会给出一些选项,如:品牌、像素、尺寸,...
分类:
其他好文 时间:
2014-12-11 00:21:48
阅读次数:
200
Mahout进阶课程,网盘下载:链接:http://pan.baidu.com/s/1dDGPM4x密码:pqdk网盘失效的话,请加QQ:3113533060课程大纲:第一周Mahout概述Mahout安装Mahout安装测试Mahout算法库介绍解析聚类算法解析分类算法协同过滤算法第二周聚类算法详解一、canopy算法简介1)mahout中canop..
分类:
其他好文 时间:
2014-12-09 15:49:26
阅读次数:
665
基于内容的推荐的基本推荐思路是:用户喜欢幻想小说,这本书是幻想小说,则用户有可能喜欢这本小说
两方面要求:(1)知道用户的喜好;(2)知道物品的属性
基于内容的推荐相比协同过滤方法(个人观点):协同过滤用到了大量用户的群体行为特征,两个特点,(1)要大量用户,(2)除了用户的行为之外,不需要其他信息;基于内容的推荐,需要用户和物品的额外信息,如:用户喜好、物品属性等等,但是不需要存储、...
分类:
其他好文 时间:
2014-12-07 23:20:43
阅读次数:
181
mahout入门指南之mahout单机版推荐算法
鄙人最近在研究mahout,网上找了一些入门资料来看,发现都整理的比较乱。折腾了一番,终于搞清楚了。为了让新手们较快入门,决定总结分享一下,写此入门指南。
mahout是什么?
mahout是一个机器学习库,里面实现了一些算法,比如推荐算法,聚类算法。
实现方式有单机内存版,也有分布式(hadoop和spark)。...
分类:
编程语言 时间:
2014-12-06 15:26:15
阅读次数:
368
介绍推荐系统的基本概念,几种推荐方法:协同过滤推荐、基于内容的推荐、基于知识的推荐,简要介绍其定义,适用的场景,在实现过程中要着重解答的问题。为以后逐渐深入了解这些内容做个概括性的介绍。...
分类:
其他好文 时间:
2014-12-05 19:24:10
阅读次数:
194
来自:http://www.codesky.net/article/201206/171862.htmlmahout的taste框架是协同过滤算法的实现。它支持DataModel,如文件、数据库、NoSQL存储等,也支持Hadoop的MapReduce。这里主要分析的基于MR的实现。基于MR的CF实...
分类:
其他好文 时间:
2014-12-04 19:41:22
阅读次数:
179
输入:“用户—物品”评分矩阵
输出:(1)用户对某个物品喜欢程度的评分;(2)对于用户,n个推荐的物品列表
1. 基于用户的最近邻推荐(user-based cf)
算法基本假设:(1)如果用户过去有相似的偏好,那么他们未来也会有相似的偏好;(2)用户的偏好不随时间变化而变化
用户相似度计算:user-based cf中pearson相关系数比较好;item-bas...
分类:
其他好文 时间:
2014-12-03 00:25:30
阅读次数:
206