作者:July。出处:结构之法算法之道本文转自互联网,仅供学习收藏只用,如有侵权,请联系本人删除。引言昨日看到几个关键词:语义分析,协同过滤,智能推荐,想着想着便兴奋了。于是昨天下午开始到今天凌晨3点,便研究了一下推荐引擎,做了初步了解。日后,自会慢慢深入仔细研究(日后的工作亦与此相关)。当然,此文...
分类:
其他好文 时间:
2014-08-30 17:34:29
阅读次数:
330
贝叶斯方法逻辑回归推荐引擎初探推荐引擎——协同过滤推荐引擎——聚类微博推荐系统基于apache mahout构建社会化推荐系统
分类:
其他好文 时间:
2014-08-28 02:04:58
阅读次数:
217
从外部看协同过滤 从互联网上寻找有用的信息越来越难,这催生了三类方法:信息检索、信息过滤和推荐系统。信息检索是指Google、百度这样的搜索引擎,这是一种被动的方式;信息过滤是指先对信息进行分类,再根据用户的偏好进行过滤,比如我们注册知乎/豆瓣/微博等时都会要求选择感兴趣的领域,之后会对我们选定领域...
分类:
其他好文 时间:
2014-08-24 01:32:51
阅读次数:
196
向量之间的相似度
度量向量之间的相似度方法很多了,你可以用距离(各种距离)的倒数,向量夹角,Pearson相关系数等。
皮尔森相关系数计算公式如下:
分子是协方差,分子是两个变量标准差的乘积。显然要求X和Y的标准差都不能为0。
因为,所以皮尔森相关系数计算公式还可以写成:
当两个变量的线性关系增强时,相关系数趋于1或-1。
用户评分预测
...
分类:
其他好文 时间:
2014-08-21 19:28:24
阅读次数:
796
主要内容:
Spotify是个类似酷我音乐的音乐网站,做个性化音乐推荐和音乐消费。作者利用deep learning结合协同过滤来做音乐推荐。
具体内容:
1. 协同过滤
基本原理:某两个用户听的歌曲都差不多,说明这两个用户听歌的兴趣、品味类似;某两个歌曲,被同一群人听,说明这两个歌曲风格类似。
缺点:
(1)没有利用歌曲本身的特征(信息)
(2)无法对“层级...
分类:
其他好文 时间:
2014-08-11 00:28:01
阅读次数:
615
集体智慧和协同过滤什么是集体智慧集体智慧 (Collective Intelligence) 并不是 Web2.0 时代特有的,只是在 Web2.0 时代,大家在 Web 应用中利用集体智慧构建更加有趣的应用或者得到更好的用户体验。集体智慧是指在大量的人群的行为和数据中收集答案,帮助你对整个人群得到...
分类:
其他好文 时间:
2014-08-08 11:51:19
阅读次数:
403
首先回顾一下,协同过滤算法主要有两种,一种是基于用户的协同过滤算法(UserCF),另一种是基于物品的协同过滤算法(ItemCF)。
基于用户的协同过滤算法主要有两步:
1)找到和目标用户兴趣相似的用户集合
2)找到这个集合中的用户喜欢的,且目标用户没有听说过的物品推荐给目标用户。
基于物品的协同过滤算法主要有两步:
1)计算物品之间的相似度。
2)根据物品的相...
分类:
其他好文 时间:
2014-07-10 21:58:52
阅读次数:
341
基于物品的协同过滤算法(ItemCF)是业界应用最多的算法,主要思想是利用用户之前有过的行为,给用户推荐和之前物品类似的物品。
基于物品的协同过滤算法主要分为两步:
1)计算物品之间的相似度。
2)根据物品的相似度和用户的历史行为给用户生成推荐列表。
第一步的关键点在于计算物品之间的相似度,这里并不采用基于内容的相似性,而是去计算在喜欢物品i的用户中有多少是喜欢物品j的,这样计算的前提是用...
分类:
其他好文 时间:
2014-07-09 09:18:19
阅读次数:
175
协同过滤是推荐算法中最基本的算法,主要分为基于用户的协同过滤算法和基于物品的协同过滤算法。
这篇文章主要介绍基于用户的协同过滤算法,简单来说,要给用户u作推荐,那么只要找出那些和u之前的行为类似的用户,即和u比较像的用户,把他们的行为推荐给用户u即可。所以基于用户的系统过滤算法包括两个步骤:1)找到和目标用户兴趣相似的用户集合 2)找到这个集合中的用户喜欢的,且目标用户没有听说过的物品...
分类:
其他好文 时间:
2014-07-08 18:02:44
阅读次数:
160
“探索推荐引擎内部的秘密”系列将带领读者从浅入深的学习探索推荐引擎的机制,实现方法,其中还涉及一些基本的优化方法,例如聚类和分类的应用。同时在理论讲解的基础上,还会结合 Apache Mahout 介绍如何在大规模数据上实现各种推荐策略,进行策略优化,构建高效的推荐引擎的方法。本文作为这个系列的第一...
分类:
其他好文 时间:
2014-06-27 14:21:53
阅读次数:
225