步骤一、下载mahout http://www.apache.org/dyn/closer.cgi/mahout/我下载的是mahout-distribution-0.9.tar.gz 16-Feb-2014 08:31 66M 步骤二、下载完成后放到Linux中并解压解压命令:tar -zxvf ...
分类:
其他好文 时间:
2014-06-20 21:09:06
阅读次数:
178
一:下载软件包下载链接:1 http://mirrors.hust.edu.cn/apache/mahout/0.9/二:解压文件1 tar -zxvf mahout-distribution-0.9-src.tar.gz -C /usr/share/2 3 tar -zxvf mahout-...
分类:
其他好文 时间:
2014-06-18 15:39:37
阅读次数:
262
运行mahout in action上的cluster示例时报错:Error: Found interface org.apache.hadoop.mapreduce.Counter, but class was expected 确定是版本问题,我的hadoop版本是2.4,但mahout目...
分类:
其他好文 时间:
2014-06-18 11:07:10
阅读次数:
394
Mahout源码目录说明mahout项目是由多个子项目组成的,各子项目分别位于源码的不同目录下,下面对mahout的组成进行介绍:1、mahout-core:核心程序模块,位于/core目录下;2、mahout-math:在核心程序中使用的一些数据通用计算模块,位于/math目录下;3、mahout...
分类:
其他好文 时间:
2014-06-18 08:41:11
阅读次数:
192
并行化频繁模式挖掘算法FP Growth及其在Mahout下的命令使用...
分类:
其他好文 时间:
2014-06-18 06:35:13
阅读次数:
186
主要介绍Hadoop家族产品,常用的项目包括Hadoop, Hive, Pig, HBase, Sqoop, Mahout, Zookeeper, Avro, Ambari, Chukwa,新增加的项目包括,YARN, Hcatalog, Oozie, Cassandra, Hama, Whirr, Flume, Bigtop, Crunch, Hue等。
从2011年开始,中国进入大数据风起云...
分类:
其他好文 时间:
2014-06-17 16:44:25
阅读次数:
310
推荐系统,主要采用对历史数据的分析计算,得到某种模型,对未来的数据进行预测。说到底,还是分类问题。
Mahout,是一个可扩展的机器学习库,可用于单机,也可用于Hadoop。
Mahout的API非常简单,实现一个推荐功能只需要如下的几行代码:
DataModel model = new FileDataModel(new File(file));//建立数据模型
UserSimil...
分类:
其他好文 时间:
2014-06-15 12:35:30
阅读次数:
193
推荐过程主要分成了如下几步来完成推荐1. 输入数据预处理2. 获取评分矩阵3.
计算物品相似度4. 矩阵乘法5. 数据过滤6. 计算推荐 测试数据user&item12345 133320 244400 355503 444414
继...
分类:
其他好文 时间:
2014-06-13 20:16:26
阅读次数:
226
通过Mahout构建推荐系统时,假设我们须要添?某些过滤规则(比方:item的创建时间在一年以内),则须要用到IDRescorer接口,该接口源代码例如以下:packageorg.apache.mahout.cf.taste.recommender;/****A{@linkRescorer}whic...
分类:
其他好文 时间:
2014-06-09 19:10:29
阅读次数:
182
Mahout之SparseVectorsFromSequenceFiles源码分析目标:将一个给定的sequence文件集合转化为SparseVectors1、对文档分词1.1)使用最新的{@link
org.apache.lucene.util.Version}创建一个...
分类:
其他好文 时间:
2014-06-08 21:56:03
阅读次数:
501