搜索关键字：mapreduce partitioner，搜索到4100个结果！码迷,mamicode.com！

How MapReduce Works

?? 一、从Map到Reduce MapReduce其实是分治算法的一种实现，其处理过程亦和用管道命令来处理十分相似，一些简单的文本字符的处理甚至也可以使用Unix的管道命令来替代，从处理流程的角度来看大概如下： cat input | grep | sort | uniq -c | cat > output # Input -> Map -> Shuffle & Sort -> R...

分类：其他好文时间：2014-10-26 17:06:35 阅读次数：278

Mahout分步式程序开发基于物品的协同过滤ItemCF

阅读导读： 1.简述用Mahout实现协同过滤ItemCF的步骤？ 2.如何用API实现Hadoop的各种HDFS命令？ 3.Kmeans.java类报错，暂时可以怎么处理？ 1. Mahout开发环境介绍在用Maven构建Mahout项目文章中，我们已经配置好了基于Maven的Mahout的开发环境，我们将继续完成Mahout的分步式的程序开发。本文的...

分类：其他好文时间：2014-10-26 14:23:16 阅读次数：297

yarn环境跑mapreduce报错某个container 600s未报告进度超时被杀

发现每次reduce阶段跑到98%，相关的container被杀，报出的log大概...

分类：其他好文时间：2014-10-25 18:49:24 阅读次数：130

用Maven构建Mahout项目【一起学Mahout】

阅读导读： 1.Mahout0.7版本和其他Mahout版本的有什么区别？ 2.简述Mahout方法中算法实现过程？ 3.R语言和Mahout生成的点，并不是重合的，原因有哪些？ 1.开发环境开发环境 Win7 64bit Java 1.6.0_45 Maven 3 Eclipse Juno Service Relea...

分类：其他好文时间：2014-10-25 11:52:47 阅读次数：275

hive学习路线

hive学习路线图：...

分类：其他好文时间：2014-10-24 23:38:46 阅读次数：354

【甘道夫】基于Mahout0.9+CDH5.2运行分布式ItemCF推荐算法

环境： hadoop-2.5.0-cdh5.2.0 mahout-0.9-cdh5.2.0 引言虽然Mahout已经宣布不再继续基于Mapreduce开发，迁移到Spark，但是实际面临的情况是公司集群没有足够的内存支持Spark这只把内存当饭吃的猛兽，再加上项目进度的压力以及开发人员的技能现状，所以不得不继续使用Mahout一段时间。今天记录...

分类：编程语言时间：2014-10-24 16:36:02 阅读次数：268

hive：框架理解

Hive是基于Hadoop平台的，它提供了类似SQL一样的查询语言HQL。有了Hive，如果使用过SQL语言，并且不理解Hadoop MapReduce运行原理，也就无法通过编程来实现MR，但是你仍然可以很容易地编写出特定查询分析的HQL语句，通过使用类似SQL的语法，将HQL查询语句提交Hiv.....

分类：其他好文时间：2014-10-24 14:23:25 阅读次数：201

MapReduce编程小结

（1）key-value到map端比较容易，每个分片都会交由一个MapTask，而每个分片由InputFormat（一般是FileInputFormat）决定（一般是64M），每个MapTask会调用N次map函数，具体是多少次map函数呢？由job.setInputForm...

分类：其他好文时间：2014-10-22 23:30:18 阅读次数：371

mapreduce 只使用Mapper往多个hbase表中写数据

只使用Mapper不使用reduce会大大减少mapreduce程序的运行时间。有时候程序会往多张hbase表写数据。所以有如题的需求。下面给出的代码，不是可以运行的代码，只是展示driver中需要进行的必要项设置，mapper类需要实现的接口，map函数需要的参数以及函数内部的处理方式。实现过程比...

分类：移动开发时间：2014-10-22 20:15:15 阅读次数：219

使用hadoop实现IP个数统计~并将结果写入数据库

通过hadoop中的MapReduce实现Apache日志中的IP个数统计，并将计算结果输出到mysql数据库中。...

分类：数据库时间：2014-10-22 12:55:09 阅读次数：419

共4100条上一页 1 ... 365 366 367 368 369 ... 410 下一页

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)