码迷,mamicode.com
首页 >  
搜索关键字:hadoop mapreduce java编程    ( 18089个结果
MapReduce案例运行
从《Hadoop权威指南》选取了一个小案例,在Hadoop集群环境中运行。1、新建JAVA类,保存书中源代码。[huser@master bin]$ vi URLCat.javaimport java.io.InputStream;import java.net.URL;import org.apa...
分类:其他好文   时间:2014-05-14 03:52:36    阅读次数:457
Hadoop 2.4.0新特性介绍
在2014年4月7日,Apache发布了Hadoop 2.4.0 。相比于hadoop 2.3.0,这个版本有了一定的改进,突出的变化可以总结为下列几点(官方文档说明): 1 支持HDFS访问控制列表(ACL,Access Control Lists)       这个特性解决了在一定情况下,文件权限访问的权限问题。其机制是基于Linux文件访问权限的特征,如果你熟悉Linux的文件访问机...
分类:其他好文   时间:2014-05-13 09:03:36    阅读次数:326
Hadoop学习
一个Hadoop集群拥有多个并行的计算机,用以存储和 Hadoop强调代码向数据迁移...
分类:其他好文   时间:2014-05-13 06:54:15    阅读次数:366
Ant编译MapReduce程序
本文记录Ant编译MapReduce程序的过程。程序使用《Hadoop MapReduce Cookbook》中的示例代码。1、安装AntAnt项目主页:http://ant.apache.org/下载二进制安装包,例如apache-ant-1.9.4-bin.tar.gz,上传到Hadoop集群环...
分类:其他好文   时间:2014-05-12 20:44:36    阅读次数:398
MapReduce_去重抽取mdn_imsi
import java.io.IOException;import org.apache.hadoop.conf.Configuration;import org.apache.hadoop.fs.Path;import org.apache.hadoop.io.IntWritable;import...
分类:其他好文   时间:2014-05-12 19:55:27    阅读次数:326
java内存泄露
Java程序中的“内存泄漏”问题摘要:由Java的内存管理机制谈起,分析了Java程序中的内存泄漏问题的原因,列举了典型的内存泄漏问题并给出了一些解决方法,最后讨论了如何找出程序中内存泄漏的问题。关键字:Java内存泄漏;Java垃圾回收器;弱引用附件:无大多数程序员都知道,使用Java编程语言的一...
分类:编程语言   时间:2014-05-12 01:00:46    阅读次数:428
Hadoop-2.2.0中文文档—— Web应用代理
Web应用代理是YARN的一部分. 默认地,它会作为 Resource Manager(RM)的一部分来运行, 但是也可以配置成独立运行的模式。使用代理的原因就是降低通过YARN的web攻击的可能性。  在YARN中,Application Master(AM) 有责任提供web界面并把链接发给RM。这给一些可能的问题打开了大门。 RM 作为一个可信的用户在运行,访问那个web地址的用户会认...
分类:Web程序   时间:2014-05-11 20:27:52    阅读次数:323
mapreduce job提交流程源码级分析(三)
mapreduce job提交流程源码级分析(二)(原创)这篇文章说到了jobSubmitClient.submitJob(jobId, submitJobDir.toString(), jobCopy.getCredentials())提交job,最终调用的是JobTracker.submit.....
分类:其他好文   时间:2014-05-11 16:32:10    阅读次数:289
MapReduce入门实例
Hadoop集群(第9期)_MapReduce初级案例1、数据去重 "数据去重"主要是为了掌握和利用并行化思想来对数据进行有意义的筛选。统计大数据集上的数据种类个数、从网站日志中计算访问地等这些看似庞杂的任务都会涉及数据去重。下面就进入这个实例的MapReduce程序设计。1.1 实例描述 对数.....
分类:其他好文   时间:2014-05-11 16:02:24    阅读次数:538
水贴王问题
水贴王问题 个人信息:就读于燕大本科软件工程专业 目前大三; 本人博客:google搜索“cqs_2012”即可; 个人爱好:酷爱数据结构和算法,希望将来从事算法工作为人民作出自己的贡献; 博客内容:水贴王问题 博客时间:2014-5-7; 编程语言:Java ; 编程坏境:Windows 7 专业版 x64; 编程工具:jdk,eclipse...
分类:其他好文   时间:2014-05-11 14:22:50    阅读次数:296
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!