一、安装mahout 1、下载mahout(mahout-distribution-0.9.tar.gz) http://pan.baidu.com/s/1kUtOMQb 2、解压至指定目录 我平时都存放在opt下面; 创建存放目录:root@master:/opt# mkdi...
分类:
其他好文 时间:
2016-01-24 15:36:49
阅读次数:
214
聚类介绍
本章包括
1 实战操作了解聚类
2.了解相似性概念
3 使用mahout运行一个简单的聚类实例
4.用于聚类的各种不同的距离测算方法
作为人类,我们倾向于与志同道合的人合作—“鸟的羽毛聚集在一起。我们能够发现重复的模式通过联系在我们的记忆中的我们看到的、听到的、问道的、尝到的东
西。 例如,相比较盐 ,糖能够是我们更...
分类:
编程语言 时间:
2016-01-19 10:47:25
阅读次数:
209
1.说几种距离测度Mahout:欧式距离测度;平方欧式距离测度;曼哈顿距离测度;余弦距离测度;加权距离测度2.K-means算法参数:3.TF-IDF加权公式:4.聚类是什么?聚类是一种无监督的机器学习任务,可以自动将数据划分成类cluster。并不需要提前告知所划分的组是什么样的,因为我们可能都不...
分类:
其他好文 时间:
2016-01-18 22:20:54
阅读次数:
339
计算公式: 并通过以下代码对Mahout in Action的结果进行了验证: 代码例如以下: ` package com.example.mahout;public class TestColl {public static void main(String[] args) {...
分类:
其他好文 时间:
2016-01-17 22:58:42
阅读次数:
266
最近这两年推荐系统特别火,本文搜集整理了一些比较好的开源推荐系统,即有轻量级的适用于做研究的SVDFeature、LibMF、LibFM等,也有重量级的适用于工业系统的 Mahout、Oryx、EasyRecd等,供大家参考。PS:这里的top 10仅代表个人观点。#1.SVDFeature主页:h...
分类:
其他好文 时间:
2016-01-14 09:38:57
阅读次数:
240
Apr 08, 2014Categories intutorialtagged withMahouthadoop协同过滤Joe Jiang前言:之前配置Mahout时测试过一个简单的推荐例子,当时是在Eclipse上运行的,由于集成插件的缘故,所以一切进行的都比较顺利,唯一不足的是那是单机运行的,没...
分类:
其他好文 时间:
2016-01-08 22:12:44
阅读次数:
1141
“探索推荐引擎内部的秘密”系列将带领读者从浅入深的学习探索推荐引擎的机制,实现方法,其中还涉及一些基本的优化方法,例如聚类和分类的应用。同时在理论讲解的基础上,还会结合 Apache Mahout 介绍如何在大规模数据上实现各种推荐策略,进行策略优化,构建高效的推荐引擎的方法。本文作为这个系列的第一...
分类:
其他好文 时间:
2016-01-08 20:18:40
阅读次数:
181
1 下载在http://archive.apache.org/dist/mahout 下载相应版本的mahout 版本,获取官网查看http://mahout.apache.org 相关的信息下载后解压,tar -zxvf mahout-distribution-0.9.tar.gz配置环境变量ex...
分类:
其他好文 时间:
2016-01-06 15:56:08
阅读次数:
171
最 近这两年推荐系统特别火,本文搜集整理了一些比较好的开源推荐系统,即有轻量级的适用于做研究的SVDFeature、LibMF、LibFM等,也有重 量级的适用于工业系统的 Mahout、Oryx、EasyRecd等,供大家参考。PS:这里的top 10仅代表个人观点。#1.SVDFeature主页...
分类:
其他好文 时间:
2015-12-28 14:17:42
阅读次数:
252
所需jar包数据格式以逗号分隔1,101,5.0
1,102,3.0
1,103,2.5
2,101,2.0
2,102,2.5
2,103,5.0
2,104,2.0
3,101,2.0
3,104,4.0
3,105,4.5
3,107,5.0
4,101,5.0
4,103,3.0
4,104,4.5
4,106,4.0
5,101,4.0
5,102,3.0
5,103,2.0
5,104,4.0
5,105,3.5
5,106,4.0
6,102,4.0
6,103,2.0
..