码迷,mamicode.com
首页 >  
搜索关键字:mahout    ( 315个结果
mahout 实现canopy
mahout0.8 实现canopy...
分类:其他好文   时间:2014-06-04 23:27:37    阅读次数:384
k-means聚类JAVA实例
k-means聚类JAVA实例,《mahout in action》第六章。...
分类:编程语言   时间:2014-06-03 05:40:35    阅读次数:400
Mahout学习之Mahout简单介绍、安装、配置、入门程序測试
一、Mahout简单介绍查了Mahout的中文意思——驭象的人,再看看Mahout的logo,好吧,想和小黄象happy地玩耍,得顺便陪陪这位驭象人耍耍了...附logo:(就是他,骑在象头上的那个Mahout)步入正文啦: Mahout是一个非常强大的数据挖掘工具,是一个分布式机器学习算法的集.....
分类:其他好文   时间:2014-06-02 08:14:03    阅读次数:273
Mahout kmeans聚类
K-means算法是最为经典的基于划分的聚类方法,是十大经典数据挖掘算法之一。K-means算法的基本思想是:以空间中k个点为中心进行聚类,对最靠近他们的对象归类。通过迭代的方法,逐次更新各聚类中心的值,直至得到最好的聚类结果。Mahout kmeans MapReduce实现的原理和上述的一致,值得注意的是,Mahout将数据存储在HDFS,用MapReduce做批量并行的计算。在做kmeans之前,需要将文本用Mahout向量化模块工具做向量化。计算过程主要分为三个步骤:初始中心选取,寻找簇中心,划分数...
分类:其他好文   时间:2014-05-26 06:00:31    阅读次数:239
Mahout 模糊kmeans
FCM 算法用一个Job寻找cluster的中心点。在map的初始化节点,加载初始化(或上一轮迭代的结果)中心点。在map中计算point 和每一个簇的亲和度。在combiner计算同一个cluster的参数,该过程只能计算同一cluster的局部信息。在reduce中首先计算同一个cluster的全局参数,然后计算该cluster是否收敛,输出cluster。...
分类:其他好文   时间:2014-05-26 04:12:39    阅读次数:302
Mahout canopy聚类
Canopy有消除孤立点的作用,而K-means在这方面却无能为力。建立canopies之后,可以删除那些包含数据点数目较少的canopy,往往这些canopy是包含孤立点的。根据canopy内点的数目,来决定聚类中心数目k,这样效果比较好。...
分类:其他好文   时间:2014-05-26 03:21:30    阅读次数:321
MAHOUT_LOCAL is not set;adding HADOOP_CONF_DIR to classpath
在Mahout中出现错误:MAHOUT_LOCAL is not set;adding HADOOP_CONF_DIR to classpath MAHOUT_LOCAL与HADOOP_CONF_DIR 以上的两个参数是控制Mahout是在本地运行还是在Hadoop上运行的关键。 $MAHOUT_HOME/bin/mahout文件指出,只要设置MAHOUT_LOCAL的值为一个非空(...
分类:其他好文   时间:2014-05-23 00:40:35    阅读次数:365
Mahout机器学习平台之聚类算法详细剖析(含实例分析)
第一部分: 学习Mahout必须要知道的资料查找技能: 学会查官方帮助文档:        解压用于安装文件(mahout-distribution-0.6.tar.gz),找到如下位置,我将该文件解压到win7的G盘mahout文件夹下,路径如下所示: G:\mahout\mahout-distribution-0.6\docs 学会查源代码的注释文档:        方案一:用ma...
分类:其他好文   时间:2014-05-22 10:37:07    阅读次数:388
Hadoop家族学习路线图
主要介绍Hadoop家族产品,常用的项目包括Hadoop, Hive, Pig, HBase, Sqoop, Mahout, Zookeeper, Avro, Ambari, Chukwa,新增加的项目包括,YARN, Hcatalog, Oozie, Cassandra, Hama, Whirr,...
分类:其他好文   时间:2014-05-21 05:55:45    阅读次数:280
【甘道夫】通过Mahout构建推荐系统--通过IDRescorer扩展评分规则
通过Mahout构建推荐系统时,如果我们需要加入某些过滤规则(比如:item的创建时间在一年以内),则需要用到IDRescorer接口,该接口源码如下: package org.apache.mahout.cf.taste.recommender; /**  *   * A {@link Rescorer} which operates on {@code long...
分类:其他好文   时间:2014-05-09 14:09:08    阅读次数:369
315条   上一页 1 ... 29 30 31 32 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!