mahout入门指南之mahout单机版推荐算法
鄙人最近在研究mahout,网上找了一些入门资料来看,发现都整理的比较乱。折腾了一番,终于搞清楚了。为了让新手们较快入门,决定总结分享一下,写此入门指南。
mahout是什么?
mahout是一个机器学习库,里面实现了一些算法,比如推荐算法,聚类算法。
实现方式有单机内存版,也有分布式(hadoop和spark)。...
分类:
编程语言 时间:
2014-12-06 15:26:15
阅读次数:
368
最近看了比较多的关于大数据处理方面的知识,但是例如Hadoop,Spark,Storm等平台大都是对于数据的存储和管理操作,并不是对于数据进行分析和处理的。所以这里就衍生出了另外一种对于数据的处理,数据挖掘。学习数据挖掘也非常偶然,首先毕竟本人一直在做的是数据方面的工作,数据挖掘相当于是对数据处理后的下一步操作,学习一下数据挖掘的基本知识,了解了解常用的一些数据挖掘算法,对我来说也是一件不错的事。...
分类:
其他好文 时间:
2014-12-05 17:27:05
阅读次数:
151
讲到Spark,我们要先讲将大数据,因为Spark是一个处理大数据的平台。那什么是大数据呢?大数据也称为海量数据,通常都是指TG级、PB级的数据,但是随着时间的流逝和验证,一些人们对大数据也发生了观念上的转变,而...
分类:
其他好文 时间:
2014-12-05 15:41:40
阅读次数:
389
众所周知,目前大数据时代数据分析处理最常提到的是两个框架,一是Hadoop,另一个无疑便是Spark,Spark基于mapreduce算法实现的分布式计算,虽然拥有着Hadoop的优点,但是关于这个架构网上的解释并不全面,此次王家林老师带我们从技术的角度去探索一下Spark。第二代大数据技术Sp.....
分类:
其他好文 时间:
2014-12-04 21:12:26
阅读次数:
201
1.?sqoop导入mysql数据出错 ????用sqoop导入mysql数据出现以下错误: 14/12/03?16:37:58?ERROR?manager.SqlManager:?Error?reading?from?database:?java.sql.SQLException:?Streaming?result?set...
分类:
其他好文 时间:
2014-12-04 16:05:46
阅读次数:
199
基于Spark On Yarn的淘宝数据挖掘平台:http://www.doc88.com/p-7804379529208.htmlSpark之MLLib机器学习库:http://blog.csdn.net/johnny_lee/article/details/25656343Spark之ALS(推...
分类:
其他好文 时间:
2014-12-02 23:49:03
阅读次数:
230
Spark版本:1.1.1本文系从官方文档翻译而来,转载请尊重译者的工作,注明以下链接:http://www.cnblogs.com/zhangningbo/p/4137969.html
分类:
Web程序 时间:
2014-12-02 19:10:37
阅读次数:
290
Spark版本:1.1.1本文系从官方文档翻译而来,转载请尊重译者的工作,注明以下链接:http://www.cnblogs.com/zhangningbo/p/4137952.html
分类:
Web程序 时间:
2014-12-02 19:02:18
阅读次数:
137
Spark版本:1.1.1本文系从官方文档翻译而来,转载请尊重译者的工作,注明以下链接:http://www.cnblogs.com/zhangningbo/p/4137979.html
分类:
Web程序 时间:
2014-12-02 18:58:17
阅读次数:
163
Spark版本:1.1.1本文系从官方文档翻译而来,转载请尊重译者的工作,注明以下链接:http://www.cnblogs.com/zhangningbo/p/4137986.html
分类:
其他好文 时间:
2014-12-02 18:50:12
阅读次数:
166