Hadoop典型应用有:搜索、日志处理、推荐系统、数据分析、视频图像分析、数据保存等Hadoop的核心是HDFS和mapreduce,两者只是理论基础,不是具体可使用的高级应用,Hadoop旗下有很多经典子项目,比如HBase、Hive等,这些都是基于HDFS和MapReduce发展出来的。mapr...
分类:
其他好文 时间:
2014-11-26 13:48:30
阅读次数:
195
假设向量1为(a1,a2,...an)
向量2为(b1,b2,...bn)
1、欧式距离测度
公式为
d=sqrt((a1-b1)^2+(a2-b2)^2+…+(an-bn)^2)
mahout类为EuclideanDistanceMeasure
2、平方欧式距离测度
公式为
d=(a1-b1)^2+(a2-b2)^2+…+(an-bn)^2
mahout类为SquaredEuc...
分类:
其他好文 时间:
2014-11-23 20:17:54
阅读次数:
232
http://in.sdo.com/?p=1386引言在互联网上,信息的数量越来越大。用户可以选择的面也越来越广,推荐系统的任务是,要从众多的资讯中,过滤并挑选出符合每个用户口味的内容,推荐给不同用户。在这个过程中,对用户兴趣的刻画、建模是最为重要的一环。传统的用户兴趣刻画,大多集中于用户基本属性上...
分类:
其他好文 时间:
2014-11-22 15:57:47
阅读次数:
271
一、基于图模型的推荐在不考虑标签时,基于二项图有两种随机游走的图推荐算法:1.probability spreading 随机游走算法,在游走中,每个目标得到权重是基于归属者的边计算出来的。每次传播(item->user->item)后用户Ui的兴趣向量:$$f_j^p=\sum_{l=1}^{n}...
分类:
其他好文 时间:
2014-11-17 15:44:44
阅读次数:
182
亚马逊的CEO Jeff Bezos曾经说过,他的梦想是“如果我有100万个用户,我就要为他们做100万个亚马逊网站”。智能推荐系统承载的就是这个梦想,即通过数据挖掘技术,为每一个用户实现个性化的推荐结果,让每个用户更便捷的获取信息。为了实现这个梦想,过去十余年间,无数顶尖技术专家和工程师投身于推荐...
分类:
其他好文 时间:
2014-11-16 11:55:28
阅读次数:
190
转载:http://blog.sina.com.cn/s/blog_602feaa80100fjq9.html在推荐系统简介中,我们给出了推荐系统的一般框架。很明显,推荐方法是整个推荐系统中最核心、最关键的部分,很大程度上决定了推荐系统性能的优劣。目前,主要的推荐方法包括:基于内容推荐、协同过滤推荐...
分类:
编程语言 时间:
2014-11-15 20:15:08
阅读次数:
253
推荐系统是近几年比较火的一个话题,尤其是Netflix举办过一次电影推荐比赛之后,ACM有专门的Recommer System的会议。关于推荐系统的分类,从不同的角度有不同的分法,传统的有两种分法,一种叫基于内容(Content based)的推荐,顾名思义就是根据要推荐的项目(电影,书籍,音乐等等...
分类:
其他好文 时间:
2014-11-14 10:43:23
阅读次数:
318
根据集体智慧编程第二章内容,运用欧几里得距离算法或者皮尔逊相关系数算法,可以在数据库(SQL Server)中实现一个简单的推荐系统。项目背景:假设现在有一组来自基金销售网站的数据,记录了投资者购买基金的品种和购买的数量占该基金发售总量的百分比,我们可以利用这组数据为购买者提供一份推荐购买的基金列表...
分类:
数据库 时间:
2014-11-13 20:24:26
阅读次数:
344
优化推荐系统的JVM关键参数-Xmx设定Java允许使用的最大堆空间。例如-Xmx512m表示堆空间上限为512MB-server现代JVM有两个重要标志:-client和-server,分别为客户端程序(运行时间短、占用资源少)和服务器端程序(长时间运行、资源密集型)选择合适的JVM配置。-d32...
分类:
其他好文 时间:
2014-11-11 15:55:12
阅读次数:
255
DataModel model=new FileDataModel(new File("intro.csv")); //.csv是逗号文件UserSimilarity similarity=new PearsonCorrelationSimilarity(model);UserNeighborhoo...
分类:
其他好文 时间:
2014-11-11 13:59:42
阅读次数:
198