数据集下载地址:http://grouplens.org/datasets/movielens/ 之前用的是100K的,现在需要下载MovieLens 10M,使用里面的ratings.dat前提:因为文件不符合mahout要求的文件输入格式,需要进行转换,但是example里提供了一个解析这个文件...
分类:
其他好文 时间:
2014-08-04 14:14:47
阅读次数:
476
Preference对象:单个用户Id,物品ID和偏好值,实现GenericPreferencePreferenceArray数组,单个用户所有偏好值数组,实现GenericPreferenceArray代码示例:package mahout;import org.apache.mahout.cf....
分类:
其他好文 时间:
2014-08-04 13:33:27
阅读次数:
196
使用GroupLens数据集ua.base这是一个tab分割的文件,用户Id,物品Id,评分(偏好值),以及附加信息。可用吗?之前使用的是CSV格式,现在是tsv格式,可用,使用FileDataModel对mahout推荐2中的评估程序使用这个数据集测试:package mahout;import ...
分类:
其他好文 时间:
2014-08-04 10:55:16
阅读次数:
764
通过估计偏好值来生成推荐结果并非绝对必要。给出一个从优到劣的推荐列表对于许多场景都够用了,而不必包含估计的偏好值。查准率:在top结果中相关结果的比例查全率:所有相关结果,包含在top结果中的比例对上个例子进行测试:package mahout;import java.io.File;import ...
分类:
其他好文 时间:
2014-08-04 10:47:37
阅读次数:
241
设计好了一个推荐程序,如何来完成评估呢?一般是使用一个真实数据的样例作为测试数据来仿真,来看估计值和实际值的差别,0.0意味着完美的估计,就是没有差别。一是使用平均差值(直观,易于理解),一是使用均方根。针对mahout推荐1的推荐程序进行评估:package mahout;import java....
分类:
其他好文 时间:
2014-08-04 10:36:46
阅读次数:
323
1、准备数据:intro.csv:1,101,5.01,102,3.01,103,2.52,101,2.02,102,2.52,103,5.02,104,2.03,101,2.53,104,4.03,105,4.53,107,5.04,101,5.04,103,3.04,104,4.54,106,4...
分类:
其他好文 时间:
2014-08-04 10:26:56
阅读次数:
194
1 安装环境 Hadoop1.2.1 分布式集群环境下安装(192.168.1.53-56) Mahout 0.9 2 安装介质 下载地址:http://archive.apache.org/dist/mahout/0.9/ 文件名(二进制):mahout-distribution-0.9...
分类:
其他好文 时间:
2014-08-03 20:33:45
阅读次数:
190
前言:配置mahout花了挺多时间的,主要是在一些小的问题上浪费了很多时间。1.下载mahout 下载地址:http://mahout.apache.org 我下载的最新版:mahout-distribution-0.92.把mahout解压到你想存放的文档,我是放在/Users/jia/Docu....
分类:
其他好文 时间:
2014-08-03 15:11:55
阅读次数:
415
①在官网下载最新的mahout版本,放在linux本机系统的/usr/local/目录下,然后解压即可tar -zxvf mahout-distribution-0.9.tar.gz②重命名解压后的文件夹为mahoutmv mahout-distribution-0.9 mahout③执行vi /e...
分类:
其他好文 时间:
2014-08-02 20:38:33
阅读次数:
208