开发+运行第一个Mahout的程序代码:/** * Licensed to the Apache Software Foundation (ASF) under one or more * contributor license agreements. See the NOTICE file di....
分类:
其他好文 时间:
2014-06-25 14:54:25
阅读次数:
328
一:简介 基于用户的协同推荐算法随着使用者数量的增多,计算的时间就会变长,所以在2001年Sarwar提出了基于项目的协同过滤推荐算法(Item-based Collaborative Filtering Algorithms)。基于用户的协同推荐mahout没有实现分布式算法,Mahout基于It...
分类:
其他好文 时间:
2014-06-23 00:05:49
阅读次数:
454
步骤一、下载mahout http://www.apache.org/dyn/closer.cgi/mahout/我下载的是mahout-distribution-0.9.tar.gz 16-Feb-2014 08:31 66M 步骤二、下载完成后放到Linux中并解压解压命令:tar -zxvf ...
分类:
其他好文 时间:
2014-06-20 21:09:06
阅读次数:
178
一:下载软件包下载链接:1 http://mirrors.hust.edu.cn/apache/mahout/0.9/二:解压文件1 tar -zxvf mahout-distribution-0.9-src.tar.gz -C /usr/share/2 3 tar -zxvf mahout-...
分类:
其他好文 时间:
2014-06-18 15:39:37
阅读次数:
262
运行mahout in action上的cluster示例时报错:Error: Found interface org.apache.hadoop.mapreduce.Counter, but class was expected 确定是版本问题,我的hadoop版本是2.4,但mahout目...
分类:
其他好文 时间:
2014-06-18 11:07:10
阅读次数:
394
Mahout源码目录说明mahout项目是由多个子项目组成的,各子项目分别位于源码的不同目录下,下面对mahout的组成进行介绍:1、mahout-core:核心程序模块,位于/core目录下;2、mahout-math:在核心程序中使用的一些数据通用计算模块,位于/math目录下;3、mahout...
分类:
其他好文 时间:
2014-06-18 08:41:11
阅读次数:
192
并行化频繁模式挖掘算法FP Growth及其在Mahout下的命令使用...
分类:
其他好文 时间:
2014-06-18 06:35:13
阅读次数:
186
主要介绍Hadoop家族产品,常用的项目包括Hadoop, Hive, Pig, HBase, Sqoop, Mahout, Zookeeper, Avro, Ambari, Chukwa,新增加的项目包括,YARN, Hcatalog, Oozie, Cassandra, Hama, Whirr, Flume, Bigtop, Crunch, Hue等。
从2011年开始,中国进入大数据风起云...
分类:
其他好文 时间:
2014-06-17 16:44:25
阅读次数:
310
推荐系统,主要采用对历史数据的分析计算,得到某种模型,对未来的数据进行预测。说到底,还是分类问题。
Mahout,是一个可扩展的机器学习库,可用于单机,也可用于Hadoop。
Mahout的API非常简单,实现一个推荐功能只需要如下的几行代码:
DataModel model = new FileDataModel(new File(file));//建立数据模型
UserSimil...
分类:
其他好文 时间:
2014-06-15 12:35:30
阅读次数:
193
推荐过程主要分成了如下几步来完成推荐1. 输入数据预处理2. 获取评分矩阵3.
计算物品相似度4. 矩阵乘法5. 数据过滤6. 计算推荐 测试数据user&item12345 133320 244400 355503 444414
继...
分类:
其他好文 时间:
2014-06-13 20:16:26
阅读次数:
226