贝叶斯定理的思想出现在18世纪,但真正大规模派上用途还得等到计算机的出现。因为这个定理需要大规模的数据计算推理才能凸显效果,它在很多计算机应用领域中都大有作为,如自然语言处理,机器学习,推荐系统,图像识别,博弈论等等。本文先介绍贝叶斯定义,然后对定义进行解释,再通过一些列子的分析,力图让贝叶斯定理通...
分类:
其他好文 时间:
2014-10-22 08:44:06
阅读次数:
308
这篇论文比较短,正如题目所说,主要还是简单地介绍了一下推荐系统的一些算法以及评估的方法。 推荐系统之前是基于关键字信息的过滤系统,后来发展成为协同过滤系统,解决了两个问题:1、通过人工审核去评价那些具有大量关键字的文档;2、基于人们的品味去过滤一些非文本文件,如音乐。 之后,推荐系统研究领域出现了分...
分类:
其他好文 时间:
2014-10-18 16:52:59
阅读次数:
236
在推荐系统简介中,我们给出了推荐系统的一般框架。很明显,推荐方法是整个推荐系统中最核心、最关键的部分,很大程度上决定了推荐系统性能的优劣。目前,主要的推荐方法包括:基于内容推荐、协同过滤推荐、基于...
分类:
编程语言 时间:
2014-10-15 23:11:11
阅读次数:
471
参考周涛的几篇二部图的文章做的实验文章列表:1,2007PRE Bipartite network projection and personal recommendation.pdf (网络结构)2,2010PNAS-Solving the apparent diversity-accuracy ...
分类:
其他好文 时间:
2014-10-13 21:28:37
阅读次数:
640
整理了一下最近对协同过滤推荐算法中的皮尔森相似度计算,顺带学习了下R语言的简单使用,也复习了概率统计知识。一、概率论和统计学概念复习1)期望值(Expected Value)因为这里每个数都是等概率的,所以就当做是数组或向量中所有元素的平均数吧。可以使用R语言中函数mean()。2)方差(Variance)方差分为population variance总体方差和sample variance样本方...
分类:
编程语言 时间:
2014-10-12 16:35:38
阅读次数:
1714
基于item的推荐是常用并且高效的一种推荐方式,最重要的是它可以做实事推荐。...
分类:
编程语言 时间:
2014-10-11 14:41:25
阅读次数:
337
使用用户打标签次数*物品打标签次数做乘积的算法虽然简单,但是会造成热门物品推荐的情况。物品标签的权重是物品打过该标签的次数,用户标签的权重是用户使用过该标签的次数,从而导致个性化的推荐降低,而造成热门推荐。
运用TF-IDF的思想可以对算法进行改进。TF-IDF(term frequemcy-inverse documnet frequency)是一种用于资讯检索和文本挖掘的加权技术。用来评估一...
分类:
其他好文 时间:
2014-10-09 01:49:57
阅读次数:
250
在现今的推荐技术和算法中,最被大家广泛认可和采用的就是基于协同过滤的推荐方法。本文将带你深入了解协同过滤的秘密。
1 什么是协同过滤
协同过滤是利用集体智慧的一个典型方法。要理解什么是协同过滤 (Collaborative Filtering, 简称 CF),首先想一个简单的问题,如果你现在想看个电影,但你不知道具体看哪部,你会怎么做?大部分的人会问问周围的朋友,看看最近有什么好看的电...
分类:
其他好文 时间:
2014-10-08 17:49:15
阅读次数:
232
论文内容:1)首先,作者提出了一个有价值的问题:给出租车司机推荐能够以最少代价载到客人的路线2)其次,问题的新颖性是,以前都是推荐分散的点,本论文是推荐路线,可以说提供的位置服务更进一步3)然后,指出该问题的两个子问题:a)如何计算每条路段的收益b)如何从复杂的路段中找到最优路段4)接着,对第一个子...
分类:
其他好文 时间:
2014-10-06 11:09:50
阅读次数:
195
Apache Mahout项目主要包括以下五个部分:
频繁模式挖掘:挖掘数据中频繁出现的项集。
聚类:将诸如文本、文档之类的数据分成局部相关的组。
分类:利用已经存在的分类文档训练分类器,对未分类的文档进行分类。
推荐引擎(协同过滤):获得用户的行为并从中发现用户可能喜欢的事务。
频繁子项挖掘:利用一个项集(查询记录或购物目录)去识别经常一起出现的项目。
在Maho...
分类:
其他好文 时间:
2014-10-06 00:55:49
阅读次数:
346