码迷,mamicode.com
首页 >  
搜索关键字:mahout    ( 315个结果
Mahout In Aciotn
Mahout In Aciotn? ? ??? ??????作者:Jack Zhang ?来自开拓者部落 ,qq群:248087140,欢迎加入我们! ????? ??????本文欢迎转载,转载请注明出处?http://my.oschina.net/u/1866370/blo...
分类:其他好文   时间:2014-07-21 10:18:06    阅读次数:254
学习Mahout (四)
在Mahout 学习(三)中,我贴了example的代码,里面生成向量文件的代码:InputDriver.runJob(input, directoryContainingConvertedInput, "org.apache.mahout.math.RandomAccessSparseVector...
分类:其他好文   时间:2014-07-19 14:14:04    阅读次数:218
Mahout源码分析-K-means聚类算法
一 算法描述1、随机选取k个对象作为初始簇中心;2、计算每个对象到簇中心的距离,将每个对象聚类到离该对象最近的聚簇中去;3、计算每个聚簇中的簇均值,并将簇均值作为新的簇中心;4、计算准则函数;5、重复(2)、(3)和(4),直到准则函数不再发生变化。二源码分析
分类:其他好文   时间:2014-07-16 21:20:48    阅读次数:202
mahout 安装
1. 下载mahout-distribution-0.5.tar.gz 并解压;2.配置环境变量: /etc/profileexport MAHOUT_HOME=/home/mahout/export PATH=$MAHOUT_HOME/bin:$PATH3. 启动hadoopstart-all.s...
分类:其他好文   时间:2014-07-11 12:17:49    阅读次数:133
Hive学习路线图
Hive学习路线图Hadoop家族系列文章,主要介绍Hadoop家族产品,常用的项目包括Hadoop, Hive, Pig, HBase, Sqoop, Mahout, Zookeeper, Avro, Ambari, Chukwa,新增加的项目包括,YARN, Hcatalog, Oozie, C...
分类:其他好文   时间:2014-07-11 08:48:52    阅读次数:291
Mahout算法调用展示平台2.1
软件版本:windows7: Tomcat7、JDK7、Spring4.0.2、Struts2.3、Hibernate4.3、myeclipse10.0、easyui;Linux(centos6.5):Hadoop2.4、Mahout1.0、JDK7;使用Web工程调用Mahout的相关算法,提供监控,查看任务的执行状态。自建Web项目,项目首页如下:1. 准备 项目可以在http://downl...
分类:其他好文   时间:2014-07-08 16:10:20    阅读次数:258
利用LDA进行文本聚类(hadoop, mahout)
项目原理概述利用sqoop将数据从MySQL导入到HDFS中,利用mahout的LDA的cvb实现对输入数据进行聚类,并将结果更新到数据库中。数据流向图如下mahout算法分析输入数据格式为的matrix矩阵,key为待聚类文本的数字编号,value为待聚类文本的单词向量Vector, Vector...
分类:其他好文   时间:2014-07-07 10:43:16    阅读次数:1186
[转载]非常的好的协同过滤入门文章
“探索推荐引擎内部的秘密”系列将带领读者从浅入深的学习探索推荐引擎的机制,实现方法,其中还涉及一些基本的优化方法,例如聚类和分类的应用。同时在理论讲解的基础上,还会结合 Apache Mahout 介绍如何在大规模数据上实现各种推荐策略,进行策略优化,构建高效的推荐引擎的方法。本文作为这个系列的第一...
分类:其他好文   时间:2014-06-27 14:21:53    阅读次数:225
学习Mahout(三)
开发+运行第一个Mahout的程序代码:/** * Licensed to the Apache Software Foundation (ASF) under one or more * contributor license agreements. See the NOTICE file di....
分类:其他好文   时间:2014-06-25 14:54:25    阅读次数:328
mahout之分布式Item-Based使用
一:简介 基于用户的协同推荐算法随着使用者数量的增多,计算的时间就会变长,所以在2001年Sarwar提出了基于项目的协同过滤推荐算法(Item-based Collaborative Filtering Algorithms)。基于用户的协同推荐mahout没有实现分布式算法,Mahout基于It...
分类:其他好文   时间:2014-06-23 00:05:49    阅读次数:454
315条   上一页 1 ... 27 28 29 30 31 32 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!