Mahout协同过滤算法 Mahout使用了Taste来提高协同过滤算法的实现,它是一个基于Java实现的可扩展的,高效的推荐引擎。Taste既实现了最基本的基于用户的和基于内容的推荐算法,同时也提供了扩展接口,使用户可以方便的定义和实现自己的推荐算法。同时,Taste不仅仅只适用于Java应用程序 ...
分类:
编程语言 时间:
2018-04-21 13:28:30
阅读次数:
228
推荐就是发掘用户集合和对象集合的语义关系,为用户提供语义最相关的 TOP-N 对象集合。 语义关系就是能读懂用户偏好兴趣的核心。 推荐系统是面向具体业务的交叉研究,无业务讲推荐系统,感觉言之无物;从技术来讲,不同的数据、不同的场景就会有不同的结果; 用户画像粒度如何控制? 是给一群人打上文艺男的标签 ...
分类:
其他好文 时间:
2018-04-19 13:56:07
阅读次数:
116
什么才是好的推荐系统?以图书推荐系统为例:首先推荐系统要满足用户的需求,要尽可能地覆盖各种图书,要能收集到高质量的用户反馈,增加用户和图书网站的交互,提高网站的收入。要能够准确预测用户的行为,还要扩展用户的视野,帮助用户发现那些他们可能会感兴趣的但却不那么容易发现的东西。本文主要从用户,网站,内容提供方提出不同的指标。三种推荐系统实验方法1、离线实验(offlineexperiment)实施步骤:
分类:
其他好文 时间:
2018-04-18 11:54:48
阅读次数:
179
框架介绍 上一篇从总体上介绍了推荐系统,推荐系统online和offline是两个组成部分,其中offline负责数据的收集,存储,统计,模型的训练等工作;online部分负责处理用户的请求,模型数据的使用,online learning等。本篇因为online中有比较复杂的ranking,rank ...
分类:
其他好文 时间:
2018-04-15 12:10:44
阅读次数:
1200
参考自:http://www.igvita.com/2007/01/15/svd-recommendation-system-in-ruby/ 看到SVD用于推荐评分矩阵的分解,主要是可以根据所需因子实现降维,最终造成的是有损的降维压缩,此处k=2 一、对于矩阵的奇异值分解 任意一个M*N的矩阵A( ...
分类:
其他好文 时间:
2018-04-13 22:37:18
阅读次数:
312
基本思想 基于用户的协同过滤算法是通过用户的历史行为数据发现用户对商品或内容的喜欢(如商品购买,收藏,内容评论或分享),并对这些喜好进行度量和打分。根据不同用户对相同商品或内容的态度和偏好程度计算用户之间的关系。在有相同喜好的用户间进行商品推荐。简单的说就是如果A,B两个用户都购买了x、y、z三本图 ...
分类:
编程语言 时间:
2018-04-06 23:41:09
阅读次数:
356
闲来无聊,整理下,以飨各位 K-means,如何用hadoop实现k-meansnaive bayes和logistic regression的区别LDA的原理和推导做广告点击率预测,用哪些数据什么算法推荐系统的算法中最近邻和矩阵分解各自适用场景 需要进行公式推导的 SVM LR 贝叶斯 LSTM ...
分类:
其他好文 时间:
2018-04-06 18:40:44
阅读次数:
505
问题描述: 数据包含了一百四十万用户对80万商品的打分。要利用基于物品的协同过滤来计算。如果直接两两计算140万维的向量相似度,肯定不行啊。 问题分析: 每个物品的向量虽然是140万维的,但是其实给一个物品打分的用户其实不多,这个矩阵是非常稀疏的。而且根据长尾问题来说,大部分物品只有很少的用户有过评 ...
分类:
其他好文 时间:
2018-04-04 12:48:00
阅读次数:
162
用户行为日志概述用户行为日志:用户每次访问网站时所有的行为数据访问、浏览、搜索、点击...用户行为轨迹、流量日志(用户行为日志的其他名称)为什么要记录用户访问行为日志:进行网站页面的访问量的统计分析网站的黏性训练推荐系统用户行为日志生成渠道:web服务器记录的web访问日志ajax记录的访问日志以及其他相关的日志用户行为日志大致内容:访问时间访问者所使用的客户端(UserAgent)访问者的IP地
分类:
其他好文 时间:
2018-04-02 16:02:41
阅读次数:
200
一、前述 根据前文中架构,本文我们讨论线下部分构建训练集部分。因为我们离线部分模型的选择是逻辑回归,所以我们数据必须有x和y. 二、具体流程 1.从数据库中分离出我们需要的数据。 用户行为表(日志) 用户历史下载表 商品词表(商品的基本特征) 2.构建训练集中的关联特征 流程: 2.构建训练集中的基 ...
分类:
其他好文 时间:
2018-03-26 19:20:18
阅读次数:
319