1.矩阵分解是推荐系统常用的手段,经常用来做用户偏好预测.在当下的推荐系统中,我们得到用户对于物品的评分矩阵往往是非常稀疏的,一个有m个用户,n个商品的网站,它所收集到的m*n用户评分矩阵R可能只有不到万分之一的数据非零.矩阵分解算法常用来构造出多个矩阵, 用这些矩阵相乘的结果R’来拟合原来的评.....
分类:
其他好文 时间:
2015-10-16 16:41:12
阅读次数:
213
这里我想给大家介绍另外一种推荐系统,这种算法叫做潜在因子(Latent Factor)算法。这种算法是在NetFlix(没错,就是用大数据捧火《纸牌屋》的那家公司)的推荐算法竞赛中获奖的算法,最早被应用于电影推荐中。这种算法在实际应用中比现在排名第一的@邰原朗所介绍的算法误差(RMSE)会小不少.....
分类:
其他好文 时间:
2015-10-15 18:16:11
阅读次数:
293
推荐系统是现今广泛运用的一种数据分析方法。常见的如,“你关注的人也关注他”,“喜欢这个物品的用户还喜欢。。”“你也许会喜欢”等等。常见的推荐系统分为基于内容的推荐与基于历史记录的推荐。基于内容的推荐,关键在于提取到有用的用户,物品信息,以此为特征向量来进行分类,回归。基于历史记录的推荐,记录用户的评...
分类:
其他好文 时间:
2015-10-09 16:48:54
阅读次数:
327
本文将按照作者学习的顺序,对推荐算法进行一个综述性的介绍,可能会有些跳跃性。一则供自己后续不时翻阅,二则分享给读者。传播知识是一件很快乐的事情。 ? ? 1. 基于相似度的方法(协同过滤) ? ? ...
分类:
编程语言 时间:
2015-10-08 16:42:27
阅读次数:
256
Mahout中对协同过滤算法进行了封装,看一个简单的基于用户的协同过滤算法。基于用户:通过用户对物品的偏好程度来计算出用户的在喜好上的近邻,从而根据近邻的喜好推测出用户的喜好并推荐。图片来源程序中用到的数据都存在MySQL数据库中,计算结果也存在MySQL中的对应用户表中。package com.m...
分类:
编程语言 时间:
2015-10-05 23:24:35
阅读次数:
362
1、动机2、基于内容的分类器3、python实现一、动机在前面的文章中介绍了基于用户和基于物品的协同过滤推荐方法,其实无论是基于用户还是基于物品,都是通过群体效应来进行推荐,因为衡量相似度的向量都是基于一定群体用户的评分,所以推荐出来的物品都是热门的流行的物品,对于一些冷门物品可能就无法收到亲睐。而...
分类:
其他好文 时间:
2015-10-05 11:34:11
阅读次数:
336
主要内容:1、k近邻2、python实现1、什么是k近邻(KNN)在入门-1中,简单地实现了基于用户协同过滤的最近邻算法,所谓最近邻,就是找到距离最近或最相似的用户,将他的物品推荐出来。而这里,k近邻(K Nearest Neighbor)的意思就是,找出最近或最相似的k个用户,将他们的评分(相似度...
分类:
其他好文 时间:
2015-10-02 11:18:36
阅读次数:
191
主要内容:1、什么是基于用户的协同过滤2、python实现1、什么是基于用户协同过滤:协同过滤:Collaborative Filtering,一般用于推荐系统,如京东,亚马逊等电商网站上的“购买该物品的用户还喜欢/购买”之类的栏目都是根据协同过滤推荐出来的。基于用户的协同过滤:User-based...
分类:
其他好文 时间:
2015-10-01 16:34:35
阅读次数:
284
这节课时郭强的三维课。他讲的是MAYA和max 。自己对这个也不怎么的感兴趣。而且这个课感觉属于数字媒体。自己对游戏,动画,这些东西一点都不兴趣,比如大一的时候刚开学的时候,张瑞的数字媒体的导论课。还有就是秀霞的动画课,自己记录一下自己的思想我在网上看见了这样一个说法,说的是跟着本科生导师做项目。就...
分类:
编程语言 时间:
2015-09-25 16:13:14
阅读次数:
240
在之前一篇博文中, 有同学在评论中问了个问题: 怎样解决因式分解带来的推荐冷门。热门关键词的问题。 在回答这个问题的时候, 想到了近几年在做搜索推荐系统的过程中, 学术界和工业界的一些差别。 正好近期正在做技术规划, 于是写偏文章说下工业界完整推荐系统的设计。结论是:没有某种算法可以全然解决这个问题...
分类:
其他好文 时间:
2015-09-24 12:30:38
阅读次数:
328