码迷,mamicode.com
首页 >  
搜索关键字:mahout lda hadoop cv    ( 16332个结果
在hadoop上运行java文件
hadoop 2.x版本编译:javac -d . -classpath /usr/lib/hadoop/hadoop-common-2.2.0.2.0.6.0-102.jar TestGetPathMark.java在com的同级目录上建立manifest.mf在里面写上Main-Class: c...
分类:编程语言   时间:2014-08-05 15:40:59    阅读次数:261
mahout0.9注意事项SlopeOneRecommender
1、今天试验SlopeOne推荐算法,结果没有提示。心想是不是少了jar包,查查不少。通过网络查询定位此类所在的位置为:org.apache.mahout.cf.taste.impl.recommender.slopeone.包下面,所以去查看jar包,发现没有。查看src包也没有这个类的源码,之后...
分类:其他好文   时间:2014-08-05 14:04:09    阅读次数:231
mahout推荐13-基于物品的推荐
基于物品的推荐,是以物品的相似度为基础的。在mahout中意味着使用ItemSimilarity实现相似性度量,而不是UserSimilarity。他们分别是通过相似的用户和相似的物品。基于物品的:了解用户的喜好,并寻找相似的物品基于用户的:寻找相似的用户,并了解他们喜好什么。如果物品数比用户数少很...
分类:其他好文   时间:2014-08-05 13:55:29    阅读次数:256
FIR on Hadoop using hadoop-streaming
Prepare Hadoop Streaming Hadoop streaming allows you to create and run Map/Reduce jobs with any executable or script as the mapper and/or the reducer....
分类:其他好文   时间:2014-08-05 13:47:29    阅读次数:426
mahout推荐12-相似度方法汇总
将各个计算用户相似度的方法弄过来了,可以参考下。实际运行代码数据文件 intro.csv内容: 直接复制就行了1,101,5.01,102,3.01,103,2.52,101,2.02,102,2.52,103,5.02,104,2.03,101,2.53,104,4.03,105,4.53,107...
分类:其他好文   时间:2014-08-05 13:38:39    阅读次数:415
Hadoop的Combiner
Hadoop的Combiner...
分类:其他好文   时间:2014-08-05 11:25:48    阅读次数:224
Spark教程-构建Spark集群-安装Ubuntu系统(1)
Unbuntu系统是我们开发Hadoop时最常用的操作系统,下面带领大家一步步完成Vmware虚拟机下Unbuntu系统的安装创建Vmware中的虚拟系统:我们选择的是“Typical”的方式,点击“Next”进入下一步:选择稍后安装操作系统,点击“Next”进入下一步:选择安装Linux系统的Ub...
分类:其他好文   时间:2014-08-05 11:04:59    阅读次数:309
连续时间查询问题-查询一个用户连续登陆天数超过N天的用户
问题:比如查询一个用户连续登陆天数超过7天的用户,或者查询连续在7天的某个时间段登陆的用户。 网上查询sql的语句的用法,对于hive来说也可以试试,查询词"SQL 连续天数查询" 如果使用hadoop如何解决?? 思路(以连续N天登陆为例): 1、计算出每天登陆的用户集合 1、使...
分类:其他好文   时间:2014-08-05 10:49:29    阅读次数:826
hadoop文件系统体系
在用Hadoop框架处理大数据时使用最多就是HDFS--分布式文件系统,但Hadoop的文件系统不仅只有分布式文件系统,例如:hfs,HSFTP,HAR等在Hadoop中都是有集成的,用来处理存储在不同体系中的数据。事实上应该这么说,Hadoop其实是一个综合性的文件系统。 下面来看看文件系统...
分类:其他好文   时间:2014-08-05 03:01:09    阅读次数:291
MapReduce源码分析之MapTask分析(二)
MapReduce源码分析之MapTask详解的后半段文章。在分析过程中我们知道了MapTask是如何使用循环缓存区管理数据,知道了数据在缓存不下是如何做spill处理的,spill输出的数据格式,combiner如何处理,如何将多一个文件merge为一个等等。也希望通过阅读这部分源码能学习到部分设计思路,能在未来的设计中提供多一种思路。...
分类:其他好文   时间:2014-08-05 00:47:18    阅读次数:484
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!