一、 用Maven搭建Mahout的开发环境
package com.panguoyuan.mahout.itemcf;
import java.io.File;
import java.io.IOException;
import java.util.List;
import org.apache.mahout.cf.taste.common.TasteException;
impor...
分类:
其他好文 时间:
2015-02-05 11:21:44
阅读次数:
308
1. 定义协同过滤(Collaborative Filtering)有狭义和广义两种意义:广义协同过滤:对来源不同的数据,根据他们的共同点做过滤处理。Collaborative filtering(CF) is a technique used by somerecommender systems....
分类:
其他好文 时间:
2015-02-01 19:09:37
阅读次数:
326
Hybrid Recommender System based on Fuzzy Clustering and Collaborative Filtering 给出题目,想找的话直接在ElsevierSD里下载即可。 并不是逐句翻译,一些简单的背景比如经济啦什么的直接忽略,不过笔者会在博文里点出来....
分类:
其他好文 时间:
2015-01-20 22:03:38
阅读次数:
352
个人评价:很有意思的一个话题,我在实际工作中也遇到过,不过这本书写的一般,有点儿“掉书袋”,太学术化、太YY、前提假设条件太强。姑且看看做借鉴吧。
通常推荐系统利用用户数据的时候,是假定用户是善良的、诚实的。而攻击,就只值认为设法影响系统的结果、性能。
攻击的维度:1. 针对某个物品,抬高或者降低其评分;2. 针对特定的用户群;3. 针对某个系统,然系统推荐不准确,甚至系统崩溃...
分类:
其他好文 时间:
2015-01-17 18:02:35
阅读次数:
222
对于在线商店,主要关心两方面:1. 提升转化率(将不消费的用户转变为消费用户);2. 提升消费额(已经花钱的人,花更多的强)
实验场所是移动互联网的一个网站,用户可以用移动设备来访问,并下载app(游戏和应用)。有些app免费,有些收费。作者利用这个实验环境对比了集中推荐算法的效果。
对比了6种方法:
1. 协同过滤;2. slope one;3. 基于内容的推荐;4. 混合推荐;5...
分类:
移动开发 时间:
2015-01-17 18:01:45
阅读次数:
253
一. mahout简介:
Mahout 是一个很强大的数据挖掘工具,是一个分布式机器学习算法的集合,包括:被称为Taste的分布式协同过滤的实现、分类、聚类等。Mahout最大的优点就是基于hadoop实现,把很多以前运行于单机上的算法,转化为了MapReduce模式,这样大大提升了算法可处理的数据量和处理性能。
以下为在mahout实现的机器学习算法:
算法类...
分类:
其他好文 时间:
2015-01-13 00:09:27
阅读次数:
251
mahout中map-reduce版的itembased推荐算法思想
最近想写一个map-reduce版的userbased,于是先研究mahout中已实现的itembased算法。itembased看起来简单,但是深入到实现细节还是有点复杂的,用map-reduce实现就更复杂了。
itembased的本质:
预测某用户user对某物品item的打分,
看看该用户对其他...
分类:
编程语言 时间:
2015-01-13 00:08:08
阅读次数:
202
一、 基于PHP实现的webshell攻击
二、 不用或少用else语句
三、 单页面结构(Single-page application)
四、 让搜索引擎抓取ajax的内容
五、 CURL_MULTI_INIT()
六、 PHP strstr()函数
七、 论规范化的重要性
八、 HHVM
九、 PHP源码签名收集器
十、 协同过滤推荐算法...
分类:
Web程序 时间:
2015-01-12 17:35:43
阅读次数:
256
数学大神、统计学大神和数据挖掘推荐大神请关注。一、数学期望的理解 早些时候,法国有两个大数学家,一个叫做布莱士·帕斯卡,一个叫做费马。帕斯卡认识两个赌徒,这两个赌徒向他提出了一个问题。他们说,他俩下赌金之后,约定谁先赢满5局,谁就获得全部赌金。赌了半天,A赢了4局,B赢了3局,时间很晚了,他们都不....
分类:
编程语言 时间:
2015-01-08 21:34:42
阅读次数:
288
一、协同过滤推荐技术一般传统的协同过滤推荐技术都是采用最近邻技术:根据系统中用户对共同评分的商品项目的历史评分信息,从而找到他们之间的相似性,生成一个最近邻居用户集合,邻居集合里的邻居和当前用户兴趣爱好相似;再利用邻居集合里的用户的评分信息,推断当前用户对推荐的目标商品的喜好程度;最后根据预测的喜好...
分类:
编程语言 时间:
2015-01-06 22:48:24
阅读次数:
196