第一阶段:hadoop的伪分布式安装 第二阶段:mahout的安装 第三阶段:20newsgroups的bayes算法测试 注意:安装完vmwaretools必须重启centos才可以生效第一阶段:hadoop的伪分布式安装 1.JDK的安装 1.1解压hadoop安装包卸载hadoop自带的jdk ...
分类:
编程语言 时间:
2016-04-03 20:25:12
阅读次数:
365
参考:从源代码剖析Mahout推荐引擎
前言:Mahout框架集成了大量的常用的机器学习算法,且都支持在Hadoop分布式环境下运行,很大程度上节约了数据处理的时间成本,其中的推荐算法引擎有cf.taste包实现,它提供了一套完整的推荐算法工具库,同时规范了数据结构,并标准了程序开发过程。
1:Mahout推荐算法介绍
2:单机内存算法实现
3:基于hadoop分布式...
分类:
编程语言 时间:
2016-04-01 18:43:15
阅读次数:
992
Hadoop家族产品,常用的项目包括Hadoop, Hive, Pig, HBase, Sqoop, Mahout, Zookeeper, Avro, Ambari, Chukwa,新增加的项目包括,YARN, Hcatalog, Oozie, Cassandra, Hama, Whirr, Flu
分类:
其他好文 时间:
2016-03-20 21:14:09
阅读次数:
253
1. hadoop、hbase、hive、spark、strom、mapreduce、mahout、zookeeper. 2.redis、dubbo、mongodb、memcache、kafka、sqoop. 3. autofac、unity、xunit. 4.serfj restlet httpc
分类:
其他好文 时间:
2016-03-09 23:48:33
阅读次数:
171
环境: hadoop-2.5.0-cdh5.2.0 mahout-0.9-cdh5.2.0 步骤: 基本思路是,将mahout下的全部jar包都引入hadoop的classpath就可以,所以改动了$HADOOP_HOME/etc/hadoop/hadoop-env.sh,加入例如以下代码将maho
分类:
其他好文 时间:
2016-03-06 19:08:06
阅读次数:
128
代码測试环境:Hadoop2.4+Mahout1.0前面博客:mahout贝叶斯算法开发思路(拓展篇)1和mahout贝叶斯算法开发思路(拓展篇)2 分析了Mahout中贝叶斯算法针对数值型数据的处理。在前面这两篇博客中并没有关于怎样分类不带标签的原始数据的处理。以下这篇博客就针对这种数据进行处理。
分类:
编程语言 时间:
2016-03-05 20:13:09
阅读次数:
298
提供一些可扩展的机器学习领域经典算法的实现,旨在帮助开发人员更加方便快捷地创建智能应用程序。Mahout包含许多实现,包括聚类、分类、推荐过滤、频繁子项挖掘。此外,通过使用 Apache Hadoop 库,Mahout 可以有效地扩展到云中。 Mahout 是一个很强大的数据挖掘工具,是一个分布式机
分类:
其他好文 时间:
2016-03-01 09:45:18
阅读次数:
190
最近这两年推荐系统特别火,本文搜集整理了一些比较好的开源推荐系统,即有轻量级的适用于做研究的SVDFeature、LibMF、LibFM等,也有重量级的适用于工业系统的Mahout、Oryx、EasyRecd等,供大家参考。PS:这里的top 10仅代表个人观点。 #1.SVDFeature 主页:
分类:
其他好文 时间:
2016-02-26 13:50:14
阅读次数:
219
Mahout实现一个基于性别的物品相似度量的方法GenderItemSimilarity...
分类:
其他好文 时间:
2016-02-19 12:43:58
阅读次数:
203