Mahout In Aciotn? ? ??? ??????作者:Jack Zhang ?来自开拓者部落 ,qq群:248087140,欢迎加入我们! ????? ??????本文欢迎转载,转载请注明出处?http://my.oschina.net/u/1866370/blo...
分类:
其他好文 时间:
2014-07-21 10:18:06
阅读次数:
254
在Mahout 学习(三)中,我贴了example的代码,里面生成向量文件的代码:InputDriver.runJob(input, directoryContainingConvertedInput, "org.apache.mahout.math.RandomAccessSparseVector...
分类:
其他好文 时间:
2014-07-19 14:14:04
阅读次数:
218
一 算法描述1、随机选取k个对象作为初始簇中心;2、计算每个对象到簇中心的距离,将每个对象聚类到离该对象最近的聚簇中去;3、计算每个聚簇中的簇均值,并将簇均值作为新的簇中心;4、计算准则函数;5、重复(2)、(3)和(4),直到准则函数不再发生变化。二源码分析
分类:
其他好文 时间:
2014-07-16 21:20:48
阅读次数:
202
1. 下载mahout-distribution-0.5.tar.gz 并解压;2.配置环境变量: /etc/profileexport MAHOUT_HOME=/home/mahout/export PATH=$MAHOUT_HOME/bin:$PATH3. 启动hadoopstart-all.s...
分类:
其他好文 时间:
2014-07-11 12:17:49
阅读次数:
133
Hive学习路线图Hadoop家族系列文章,主要介绍Hadoop家族产品,常用的项目包括Hadoop, Hive, Pig, HBase, Sqoop, Mahout, Zookeeper, Avro, Ambari, Chukwa,新增加的项目包括,YARN, Hcatalog, Oozie, C...
分类:
其他好文 时间:
2014-07-11 08:48:52
阅读次数:
291
软件版本:windows7: Tomcat7、JDK7、Spring4.0.2、Struts2.3、Hibernate4.3、myeclipse10.0、easyui;Linux(centos6.5):Hadoop2.4、Mahout1.0、JDK7;使用Web工程调用Mahout的相关算法,提供监控,查看任务的执行状态。自建Web项目,项目首页如下:1. 准备 项目可以在http://downl...
分类:
其他好文 时间:
2014-07-08 16:10:20
阅读次数:
258
项目原理概述利用sqoop将数据从MySQL导入到HDFS中,利用mahout的LDA的cvb实现对输入数据进行聚类,并将结果更新到数据库中。数据流向图如下mahout算法分析输入数据格式为的matrix矩阵,key为待聚类文本的数字编号,value为待聚类文本的单词向量Vector, Vector...
分类:
其他好文 时间:
2014-07-07 10:43:16
阅读次数:
1186
“探索推荐引擎内部的秘密”系列将带领读者从浅入深的学习探索推荐引擎的机制,实现方法,其中还涉及一些基本的优化方法,例如聚类和分类的应用。同时在理论讲解的基础上,还会结合 Apache Mahout 介绍如何在大规模数据上实现各种推荐策略,进行策略优化,构建高效的推荐引擎的方法。本文作为这个系列的第一...
分类:
其他好文 时间:
2014-06-27 14:21:53
阅读次数:
225
开发+运行第一个Mahout的程序代码:/** * Licensed to the Apache Software Foundation (ASF) under one or more * contributor license agreements. See the NOTICE file di....
分类:
其他好文 时间:
2014-06-25 14:54:25
阅读次数:
328
一:简介 基于用户的协同推荐算法随着使用者数量的增多,计算的时间就会变长,所以在2001年Sarwar提出了基于项目的协同过滤推荐算法(Item-based Collaborative Filtering Algorithms)。基于用户的协同推荐mahout没有实现分布式算法,Mahout基于It...
分类:
其他好文 时间:
2014-06-23 00:05:49
阅读次数:
454