开篇先推荐几篇关于推荐的文章,个人感觉对于入门非常有实际意义,是IBM的project师写的,例如以下:探索推荐引擎内部的秘密,第 1 部分: 推荐引擎初探探索推荐引擎内部的秘密,第 2 部分: 深入推荐引擎相关算法 - 协同过滤探索推荐引擎内部的秘密,第 3 部分: 深入推荐引擎相关算法 - 聚类...
分类:
其他好文 时间:
2015-03-28 21:34:50
阅读次数:
145
基于Hadoop2.0、YARN技术的大数据高阶应用实战(Hadoop2.0\YARN\MapReduce\数据挖掘\项目实战)课程分类:Hadoop适合人群:高级课时数量:81课时用到技术:基于协同过滤的推荐系统、基于HBase的爬虫调度库涉及项目:银行人民币查询系统、HBase编程实践及案例分析...
分类:
其他好文 时间:
2015-03-11 16:34:36
阅读次数:
138
下面这是论文笔记,其实主要是摘抄,这片博士论文很有逻辑性,层层深入,所以笔者保留的比较多。 看到第二章,我发现其实这片文章对我来说更多是科普,科普吧…… 一、论文来源 Personalized Web Recommendation via Collaborative Filtering(很奇怪via...
分类:
Web程序 时间:
2015-03-10 16:58:55
阅读次数:
321
基于Hadoop2.0、YARN技术的大数据高阶应用实战(Hadoop2.0\YARN\MapReduce\数据挖掘\项目实战)课程分类:Hadoop适合人群:高级课时数量:81课时用到技术:基于协同过滤的推荐系统、基于HBase的爬虫调度库涉及项目:银行人民币查询系统、HBase编程实践及案例分析...
分类:
其他好文 时间:
2015-03-10 15:19:43
阅读次数:
155
在现今的推荐技术和算法中,最被大家广泛认可和采用的就是基于协同过滤的推荐方法。本文将带你深入了解协同过滤的秘密。下面直接进入正题1 什么是协同过滤协同过滤是利用集体智慧的一个典型方法。要理解什么是协同过滤 (Collaborative Filtering, 简称 CF),首先想一个简单的问题,如果你...
分类:
其他好文 时间:
2015-03-09 10:32:08
阅读次数:
142
Mahout 是一个很强大的数据挖掘工具,是一个分布式机器学习算法的集合,包括:被称为Taste的分布式协同过滤的实现、分类、聚类等。Mahout最大的优点就是基于hadoop实现,把很多以前运行于单机上的算法,转化为了MapReduce模式,这样大大提升了算法可处理的数据量和处理性能。
一、Mahout安装、配置
1、下载并解压Mahout
http://archive.apac...
分类:
其他好文 时间:
2015-03-07 17:15:35
阅读次数:
554
SlopeOne算法是一个非常简单的协同过滤算法,主要思想如下:如果用户u对物品j打过分,现在要对物品i打分,那么只需要计算出在同时对物品i和j打分的这种人中,他们的分数之差平均是多少,那么我们就可以根据这个分数之差来计算用户u对物品i的打分了,当然,这样的物品j也有很多个,那有的物品和j共同打分的人少,有的物品和j共同打分的人多,那么显而易见,共同打分多的那个物品在评分时所占的比重应该大一些。
...
分类:
编程语言 时间:
2015-02-25 23:46:00
阅读次数:
295
主要参考论文《A Guide to Singular Value Decomp osition for Collab orative Filtering》
其实一开始是比较疑惑的,因为一开始没有查看论文,只是网上搜了一下svd的概念和用法,搜到的很多都是如下的公式:其中假设C是m*n的话,那么可以得到三个分解后的矩阵,分别为m*r,r*r,r*n,这样的话就可以大大降低存储代价,但是这里特别需要...
分类:
编程语言 时间:
2015-02-16 13:07:27
阅读次数:
641
前言用Mahout来构建推荐系统,是一件既简单又困难的事情。简单是因为Mahout完整地封装了“协同过滤”算法,并实现了并行化,提供非常简单的API接口;困难是因为我们不了解算法细节,很难去根据业务的场景进行算法配置和调优。本文将深入算法API去解释Mahout推荐算法底层的一些事。目录Mahout...
分类:
编程语言 时间:
2015-02-11 16:21:05
阅读次数:
305
协同过滤算法简介
协同过滤算法在推荐系统算法领域中也已经被研究了许多年,提出了不少的方法,我们就来把这些算法归类一下。
协同过滤方法的一个基本假设就是,如果用户A和用户B在一些物品偏好上,具有相似的历史标注模式或者行为习惯,那么他们在其余项目上都具有一定相似的兴趣。
协同过滤算法主要分为两大类:基于内存的方法、基于模型的方法。而协同过滤算法...
分类:
编程语言 时间:
2015-02-05 16:32:40
阅读次数:
208