在推荐系统简介中,我们给出了推荐系统的一般框架。很明显,推荐方法是整个推荐系统中最核心、最关键的部分,很大程度上决定了推荐系统性能的优劣。目前,主要的推荐方法包括:基于内容推荐、协同过滤推荐、基于...
分类:
编程语言 时间:
2014-10-15 23:11:11
阅读次数:
471
整理了一下最近对协同过滤推荐算法中的皮尔森相似度计算,顺带学习了下R语言的简单使用,也复习了概率统计知识。一、概率论和统计学概念复习1)期望值(Expected Value)因为这里每个数都是等概率的,所以就当做是数组或向量中所有元素的平均数吧。可以使用R语言中函数mean()。2)方差(Variance)方差分为population variance总体方差和sample variance样本方...
分类:
编程语言 时间:
2014-10-12 16:35:38
阅读次数:
1714
在现今的推荐技术和算法中,最被大家广泛认可和采用的就是基于协同过滤的推荐方法。本文将带你深入了解协同过滤的秘密。
1 什么是协同过滤
协同过滤是利用集体智慧的一个典型方法。要理解什么是协同过滤 (Collaborative Filtering, 简称 CF),首先想一个简单的问题,如果你现在想看个电影,但你不知道具体看哪部,你会怎么做?大部分的人会问问周围的朋友,看看最近有什么好看的电...
分类:
其他好文 时间:
2014-10-08 17:49:15
阅读次数:
232
Apache Mahout项目主要包括以下五个部分:
频繁模式挖掘:挖掘数据中频繁出现的项集。
聚类:将诸如文本、文档之类的数据分成局部相关的组。
分类:利用已经存在的分类文档训练分类器,对未分类的文档进行分类。
推荐引擎(协同过滤):获得用户的行为并从中发现用户可能喜欢的事务。
频繁子项挖掘:利用一个项集(查询记录或购物目录)去识别经常一起出现的项目。
在Maho...
分类:
其他好文 时间:
2014-10-06 00:55:49
阅读次数:
346
好早的时候就打算写这篇文章,但是还是参加阿里大数据竞赛的第一季三月份的时候实验就完成了,硬生生是拖到了十一假期,自己也是醉了。。。找工作不是很顺利,希望写点东西回顾一下知识,然后再攒点人品吧,只能如此了。
一、问题背景
二、基于用户的协同过滤算法介绍
三、数据结构和实验过程设计
四、代码...
分类:
编程语言 时间:
2014-10-03 21:50:45
阅读次数:
281
首先,要实现协同过滤,需要一下几个步骤:1.收集用户偏好;2.找到相似的用户或物品;3.计算推荐
分类:
其他好文 时间:
2014-09-14 23:26:37
阅读次数:
493
基于协同过滤的推荐 ,根据用户对物品或者信息的偏好,发现物品或者内容本身的相关性,或者是发现用户的相关性,然后再基于这些关联性进行推荐。
分类:
其他好文 时间:
2014-09-14 21:56:47
阅读次数:
446
最近学习hadoop,很多算法需要利用到矩阵计算,,例如:协同过滤,pagerank等等所以练习一下, publicstaticvoidm1(){
//根据矩阵乘法的规则,a[4*3]*b[3,2],
//将会得到一个r[4*2]的新矩阵
//r[i][j]=a[i][0]*b[0][j]+
//a[i][1]*b[1][j]+
//a[i][2]*b[2][j]
i..
分类:
编程语言 时间:
2014-09-08 10:59:07
阅读次数:
261
最近在看推荐系统。主要是看《智能web算法》和《推荐系统实战》这两本书。《智能web算法》中推荐系统只花一个章节来讲。《推荐系统实战》整本书都是在讲推荐的内容。有兴趣的朋友可以看看。在此慢慢写下笔记与诸位来宾交流交流推荐系统应用广泛。推荐的方式也多种多样。比较常用的有三种方式。1.社会化推荐;2.协...
分类:
其他好文 时间:
2014-09-04 00:04:27
阅读次数:
421
最近一直在学习hadoop一直没有梳理接触到的东西,常见算法分类:推荐系统(推荐引擎):基于用户的协同过滤算法UserCF近邻算法,容易实现基于物品的协同过滤算法ItemCF速度快,容易实现分布式计算SlopeOne算法@Deprecatedatmahout0.8KNNLinearinterpolationitem–based推荐算?.
分类:
其他好文 时间:
2014-09-03 18:29:07
阅读次数:
221