应用于推荐系统
在使用LDA(Latent Dirichlet Allocation)计算物品的内容相似度时,我们可以先计算出物品在话题上的分布,然后利用两个物品的话题分布计算物品的相似度。比如,如果两个物品的话题分布相似,则认为两个物品具有较高的相似度,反之则认为两个物品的相似度较低。计算分布的相似度可以利用KL散度来计算:
DKL(p||q)=∑i∈Xp(i)ln(p(i)/q(i),其中...
分类:
其他好文 时间:
2015-05-12 11:28:46
阅读次数:
175
这一阵子在找实习,总的情况来看,一点都不理想,做了总结,主要是由于我的理论不够扎实,实践又不多导致的,其实这两者是有一定的联系的,因为实践的不多,所以理论上的提升就非常的有限。最近比较喜欢推荐系统相关的内容,因此就找了项亮的《推荐系统实践》来看,心想现在终于可以理论和实践相结合了。 刚开始读这本.....
分类:
其他好文 时间:
2015-05-09 11:40:56
阅读次数:
126
触屏买回来 好久没有用,最近发现他是可触摸的。鼓捣了一下。个人使用的是树莓派官方推荐系统, 版本是这个版本最好的地方在于,内核已经编译了eGalax触屏,apt-get upgrade 更新系统到最近即可使用触屏。给触屏校准就可以了,校准工具xinput-calibrator, 直接wget到本地,...
分类:
其他好文 时间:
2015-05-08 17:57:49
阅读次数:
147
一、因子分解机FM的模型
因子分解机(Factorization Machine, FM)是由Steffen
Rendle提出的一种基于矩阵分解的机器学习算法。
1、因子分解机FM的优势
对于因子分解机FM来说,最大的特点是对于稀疏的数据具有很好的学习能力。现实中稀疏的数据很多,例如作者所举的推荐系统的例子便是一个很直观的具有稀疏特点的例子。
2、因子分解机FM的...
分类:
编程语言 时间:
2015-05-06 15:14:20
阅读次数:
222
一.算法实现 基于p-stable分布,并以‘哈希技术分类’中的分层法为使用方法,就产生了E2LSH算法。 E2LSH中的哈希函数定义如下: 其中,v为d维原始数据,a为随机变量,由正态分布产生; w为宽度值,因为a?v+b得到的是一个实数,如果不加以处理,那么起不到桶的效果,w是...
分类:
编程语言 时间:
2015-05-06 10:55:56
阅读次数:
222
1.关于推荐系统中的特征工程 2.Java程序员最喜欢的11款免费IDE编辑器 3.人工智能和机器学习领域的一些有趣的开源项目
分类:
其他好文 时间:
2015-05-02 12:21:29
阅读次数:
104
在推荐系统众多方法中,基于用户的协同过滤推荐算法是最早诞生的,原理也较为简单。该算法1992年提出并用于邮件过滤系统,一直到2000年,该算法都是推荐系统领域最著名的算法。 本文简单介绍基于用户的协同过滤算法思想以及原理,最后基于该算法实现园友的推荐,即根据你关注的人,为你推荐博客园中其他你有可能感...
分类:
编程语言 时间:
2015-04-30 06:19:35
阅读次数:
209
用户行为数据的收集无疑是构建推荐系统的先决条件,而Apache基金会下的Flume项目正是为分布式的日志收集量身打造的,本文是flume基本用法的调研笔记。
本文所用的Flume版本为目前最新版的ver1.5.2,它属于Flume-NG,在系统架构上与Flume-OG有所区别,二者的不同可以参考FlumeWiki文档的说明。
1. Flume是什么
Flume是Apache基金会下的一个开源...
分类:
Web程序 时间:
2015-04-29 19:50:05
阅读次数:
356
1. 基于用户的协同过滤基于用户(User-Based)的协同过滤算法首先要根据用户历史行为信息,寻找与新用户相似的其他用户;同时,根据这些相似用户对其他项的评价信息预测当前新用户可能喜欢的项。给定用户评分数据矩阵R,基于用户的协同过滤算法需要定义相似度函数s:U×U→R,以计算用户之间的相似度,然...
分类:
其他好文 时间:
2015-04-27 12:56:37
阅读次数:
636
场景: 一个新妈妈给刚出生的宝宝买用品,随着宝宝的长大,不同的阶段需要不同的物品。 这个场景中涉及到考虑用户所处阶段,给用户推荐物品的问题。 如果使用用户协同过滤,则需要根据购买记录,找到与用户处于同一阶段的用户。 不加入分类信息,单纯使用物品信息,则可能因为买了不同牌子的尿布,而判断为非相似用户,...
分类:
编程语言 时间:
2015-04-27 00:20:42
阅读次数:
186