原文作者:新浪微博@王小科科科本文由36大数据翻译组-大海翻译,转载必须获得本站、原作者、译者的同意,拒绝任何不表明译者及来源的转载!如何提高推荐算法的有效性?主要的方法是特征转化,模型选取,数据处理等等。降维是特征加工中的一个重要部分。这篇博文主要讲述如何利用降维方法来提高以用户为基础的协同过滤方...
分类:
其他好文 时间:
2015-04-08 06:29:12
阅读次数:
139
Collaborative Filtering协同过滤的主要目标:由于网络信息量的增多,用户往往被淹没在信息的海洋里,很难很轻易的找到自己感兴趣的topic。协同过滤就是为了把用户最可能感兴趣的信息推送给用户(Recommer system)。协同过滤的方法: model-base,user-bas...
分类:
其他好文 时间:
2015-04-06 15:39:52
阅读次数:
163
Mahout主要有协同过滤、聚类和分类三种算法的实现。现在我们就用Mahout来实现经典的Kmeans聚类算法。并且在Hadoop平台上跑出个结果!...
分类:
编程语言 时间:
2015-04-05 16:03:20
阅读次数:
329
第 3 部分: 深入推荐引擎相关算法 - 聚类智能推荐大都基于海量数据的计算和处理,然而我们发现在海量数据上高效的运行协同过滤算法以及其他推荐策略这样高复杂的算法是有很大的挑战的,在面对解决这个问题的过程中,大家提出了很多减少计算量的方法,而聚类无疑是其中最优的选择之一。 聚类 (Clusterin...
分类:
编程语言 时间:
2015-04-04 12:03:06
阅读次数:
145
本文总结了多种推荐场景中的注意事项,或者推荐中比较关键的因素,不涉及算法描述,仅仅说明关注点,仅供参考。
推荐算法有很多种,从算法的角度来说,我认为主要由以下几种:协同过滤系列(基于item和user),机器学习分类系列(喜欢和不喜欢二分类,或者回归中的分值代表喜欢程度),矩阵分解系列(mahout ALS算法,netflix举行推荐大赛获奖算法),关联规则(电商常用)。本文将从以上几种系列进行总结。...
分类:
编程语言 时间:
2015-04-03 17:31:18
阅读次数:
251
机器学习Machine Learning - Andrew NG
courses学习笔记
Recommender Systems 推荐系统
Problem Formulation 问题的提出
Content Based Recommendations基于内容的推荐
Collaborative Filtering协同过滤
Collaborative...
分类:
系统相关 时间:
2015-04-03 11:29:27
阅读次数:
334
第 2 部分: 深入推荐引擎相关算法 - 协同过滤本系列的第一篇为读者概要介绍了推荐引擎,下面几篇文章将深入介绍推荐引擎的相关算法,并帮助读者高效的实现这些算法。 在现今的推荐技术和算法中,最被大家广泛认可和采用的就是基于协同过滤的推荐方法。它以其方法模型简单,数据依赖性低,数据方便采集 , 推荐效...
分类:
编程语言 时间:
2015-04-02 23:51:42
阅读次数:
203
今天要讲的主要内容是协同过滤,即Collaborative Filtering,简称CF。
Contents
1. 协同过滤的简介
2. 协同过滤的核心
3. 协同过滤的实现
4. 协同过滤的应用
1. 协同过滤的简介
关于协同过滤的一个最经典的例子就是看电影,有时候不知道哪一部电影是我们喜欢的或者评分比较高的,那...
分类:
编程语言 时间:
2015-03-30 01:38:33
阅读次数:
255
1. 推荐的种类
a) 朋友推荐,这叫社会化推荐,通过社交网络搞定。比如你女朋友like的零食,通过人人网推荐给你,你想不买都不行。
b) 推荐和自己喜欢的物品某种属性一致的物品,这叫基于内容的推荐。比如我喜欢宁浩的电影,以前在豆瓣上like了疯狂的石头,然后很快豆瓣就开始给我推荐《无人区》,我一看,比石头还好---好吧,夹带私货了。
c) 把人和人喜欢的物品总和起来考虑,要么推荐和我相...
分类:
其他好文 时间:
2015-03-29 18:07:25
阅读次数:
639
Mahout是一个很强大的数据挖掘工具,是一个分布式机器学习算法的集合,包括:被称为Taste的分布式协同过滤的实现、分类、聚类等。 Mahout最大的优点就是基于hadoop实现,把很多以前运行于单机上的算法,转化为了MapReduce模式,这样大大提升了算法可处理的数据量和处理性能。下载Maho...
分类:
其他好文 时间:
2015-03-29 17:54:37
阅读次数:
147