码迷,mamicode.com
首页 >  
搜索关键字:mahout 机器学习的基本原理    ( 317个结果
【甘道夫】通过Mahout构建推荐系统--通过IDRescorer扩展评分规则
通过Mahout构建推荐系统时,假设我们须要添?某些过滤规则(比方:item的创建时间在一年以内),则须要用到IDRescorer接口,该接口源代码例如以下:packageorg.apache.mahout.cf.taste.recommender;/****A{@linkRescorer}whic...
分类:其他好文   时间:2014-06-09 19:10:29    阅读次数:182
TFIDF文档向量化-Mahout_MapReduce
Mahout之SparseVectorsFromSequenceFiles源码分析目标:将一个给定的sequence文件集合转化为SparseVectors1、对文档分词1.1)使用最新的{@link org.apache.lucene.util.Version}创建一个...
分类:其他好文   时间:2014-06-08 21:56:03    阅读次数:501
mahout 实现canopy
mahout0.8 实现canopy...
分类:其他好文   时间:2014-06-04 23:27:37    阅读次数:384
k-means聚类JAVA实例
k-means聚类JAVA实例,《mahout in action》第六章。...
分类:编程语言   时间:2014-06-03 05:40:35    阅读次数:400
Mahout学习之Mahout简单介绍、安装、配置、入门程序測试
一、Mahout简单介绍查了Mahout的中文意思——驭象的人,再看看Mahout的logo,好吧,想和小黄象happy地玩耍,得顺便陪陪这位驭象人耍耍了...附logo:(就是他,骑在象头上的那个Mahout)步入正文啦: Mahout是一个非常强大的数据挖掘工具,是一个分布式机器学习算法的集.....
分类:其他好文   时间:2014-06-02 08:14:03    阅读次数:273
Mahout kmeans聚类
K-means算法是最为经典的基于划分的聚类方法,是十大经典数据挖掘算法之一。K-means算法的基本思想是:以空间中k个点为中心进行聚类,对最靠近他们的对象归类。通过迭代的方法,逐次更新各聚类中心的值,直至得到最好的聚类结果。Mahout kmeans MapReduce实现的原理和上述的一致,值得注意的是,Mahout将数据存储在HDFS,用MapReduce做批量并行的计算。在做kmeans之前,需要将文本用Mahout向量化模块工具做向量化。计算过程主要分为三个步骤:初始中心选取,寻找簇中心,划分数...
分类:其他好文   时间:2014-05-26 06:00:31    阅读次数:239
Mahout 模糊kmeans
FCM 算法用一个Job寻找cluster的中心点。在map的初始化节点,加载初始化(或上一轮迭代的结果)中心点。在map中计算point 和每一个簇的亲和度。在combiner计算同一个cluster的参数,该过程只能计算同一cluster的局部信息。在reduce中首先计算同一个cluster的全局参数,然后计算该cluster是否收敛,输出cluster。...
分类:其他好文   时间:2014-05-26 04:12:39    阅读次数:302
Mahout canopy聚类
Canopy有消除孤立点的作用,而K-means在这方面却无能为力。建立canopies之后,可以删除那些包含数据点数目较少的canopy,往往这些canopy是包含孤立点的。根据canopy内点的数目,来决定聚类中心数目k,这样效果比较好。...
分类:其他好文   时间:2014-05-26 03:21:30    阅读次数:321
MAHOUT_LOCAL is not set;adding HADOOP_CONF_DIR to classpath
在Mahout中出现错误:MAHOUT_LOCAL is not set;adding HADOOP_CONF_DIR to classpath MAHOUT_LOCAL与HADOOP_CONF_DIR 以上的两个参数是控制Mahout是在本地运行还是在Hadoop上运行的关键。 $MAHOUT_HOME/bin/mahout文件指出,只要设置MAHOUT_LOCAL的值为一个非空(...
分类:其他好文   时间:2014-05-23 00:40:35    阅读次数:365
Hadoop家族学习路线图
主要介绍Hadoop家族产品,常用的项目包括Hadoop, Hive, Pig, HBase, Sqoop, Mahout, Zookeeper, Avro, Ambari, Chukwa,新增加的项目包括,YARN, Hcatalog, Oozie, Cassandra, Hama, Whirr,...
分类:其他好文   时间:2014-05-21 05:55:45    阅读次数:280
317条   上一页 1 ... 29 30 31 32 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!