通用机器学习MLlib in Apache Spark—Spark中的分布式机器学习程序库Mahout—分布式的机器学习库Stanford Classifier—斯坦福大学的分类器Weka—Weka是数据挖掘方面的机器学习算法集。ORYX—提供一个简单的大规模实时机器学习/预测分析基础架构。数据分析...
分类:
其他好文 时间:
2015-05-15 19:20:34
阅读次数:
241
mahout已经提供了item-based cf 算法,但是要想在mahout 算法上修改item-based cf相对来说比较繁琐,比如加入流行度因子降权(降低流行用户与其它用户的相似度)等因素。目前在spark官方没有提供基于item或者user的协同过滤,本文参考了Movie Recommendations and More With Spark文章,写了item-based的协同过滤算法...
分类:
其他好文 时间:
2015-05-14 14:24:29
阅读次数:
1683
最近在为找工作准备,于是把原来学习过的算法和还没有接触过的算法一一翻出来总结一番。ALS-WR算法是我比较欣赏的一个推荐算法。能够决解很多问题,比SVD还要好用,就是实现起来有点费劲。然而这个算法却在网上比较难找,出现最多的就是大神fansy1990的博文,他的博文分析的很全面,有大局观。但是在ALS_WR算法上也出现了一定的迷惑性。让初学者不知所云。基于此决定自己总结供大家参考,再次表示抱歉,贴图是自己手写的,博文里编辑公式还是硬伤。...
分类:
编程语言 时间:
2015-05-13 21:53:42
阅读次数:
506
Mahout对于定制的GroupLens推荐进行评估...
分类:
其他好文 时间:
2015-05-12 09:23:04
阅读次数:
130
Mahout对于GroupLens数据定制的推荐引擎...
分类:
其他好文 时间:
2015-05-11 16:05:46
阅读次数:
249
Other CentOS 7.1 Released: Installation Guide with Screenshots A Git Style Guide Recommender System with Mahout and ElasticSearch Best Practices for H...
分类:
其他好文 时间:
2015-05-10 21:59:57
阅读次数:
160
mahout利用布尔型数据评估查准率和查全率...
分类:
其他好文 时间:
2015-05-06 17:55:48
阅读次数:
196
/*
* 查准率和查全率评估的配置与运行
*
* */
package byuser;
import java.io.File;
import org.apache.mahout.cf.taste.common.TasteException;
import org.apache.mahout.cf.taste.eval.IRStatistics;
import org.apache.m...
分类:
其他好文 时间:
2015-05-04 18:06:39
阅读次数:
139