码迷,mamicode.com
首页 >  
搜索关键字:hadoop中    ( 495个结果
Hadoop的压缩算法
常见数据压缩算法压缩文件压缩主要有两个好处,一是减少了存储文件所占空间,另一个就是为数据传输提速。在hadoop大数据的背景下,这两点尤为重要,那么我现在就先来了解下hadoop中的文件压缩。hadoop里支持很多种压缩格式,我们看一个表格: LZO和LZ4算法已经不在Hadoop1.x中使用了。1、DEFLATE是同时使用了LZ77与哈夫曼编码的一个无损数据压缩算法, 源代码可以在zlib...
分类:编程语言   时间:2015-06-05 21:17:42    阅读次数:354
编译hadoop eclipse的插件(hadoop1.0)
原创文章,转载请注明:转载自工学1号馆欢迎关注我的个人博客:www.wuyudong.com, 更多云计算与大数据的精彩文章在hadoop-1.0中,不像0.20.2版本,有现成的eclipse-plugin源码包,而是在HADOOP_HOME/src/contrib/eclipse-plugin目...
分类:系统相关   时间:2015-05-30 07:01:29    阅读次数:184
Hadoop中NameNode、DataNode和Client三者之间的通信方式是什么?怎样进行合作?
一直没有重视三者之间的通信问题,在此整理一下提问:datanode之间有没有交互?Hadoop安装时ssh如何配置?1.背景知识:在Hadoop系统中,master/slaves/client的对应关系是:master---namenode;slaves---datanode;client---df...
分类:其他好文   时间:2015-05-25 00:57:54    阅读次数:424
Hadoop之——HDFS操作实例
本文通过两种方式来讲解hadoop中对HDFS文件系统的操作,第一种方式是命令行,第二种方式是通过java代码来实现。       一、命令行方式:hadoop fs xxx          hadoop fs xxx  hadoop fs -ls  /    查看hdfs的根目录下的内容的          hadoop fs -lsr /    递归查看hdfs的根目录下的内容的...
分类:其他好文   时间:2015-05-22 22:37:35    阅读次数:165
[转] DAG算法在hadoop中的应用
http://jiezhu2007.iteye.com/blog/2041422大学里面数据结构里面有专门的一章图论,可惜当年没有认真学习,现在不得不再次捡 起来。真是少壮不努力,老大徒伤悲呀!什么是DAG(Directed Acyclical Graphs),先来看下教科书上的定义吧:如果一个有向...
分类:编程语言   时间:2015-05-18 12:31:48    阅读次数:190
Hadoop 学习笔记四--JobTracker 的执行过程
Hadoop中MapReduce 的执行也是采用Master/Slave 主从结构的方式。其中JobTracker 充当了Master的角色,而TaskTracker 充当了Slave 的角色。Master负责接受客户端提交的Job,然后调度Job的每一个子任务Task运行于Slave上,并监控.....
分类:其他好文   时间:2015-05-06 22:39:19    阅读次数:207
Hadoop 学习笔记一 ---MapReduce 的输入和输出
Hadoop 中的MapReduce库支持几种不同格式的输入数据。例如,文本模式的输入数据的每一行被视为一个key/value pair,其中key为文件的偏移量,value为那一行的内容。每一种输入类型的实现都必须能够把输入数据分割成数据片段,并能够由单独的Map任务来对数据片段进行后续处理。一....
分类:其他好文   时间:2015-05-05 23:24:26    阅读次数:197
Hadoop中的MultipleOutputs实践
本例子采用hadoop1.1.2版本采用气象数据作为处理数据1、MultipleOutputs例子,具体解释在代码中有注释packageStationPatitioner; importjava.io.IOException; importjava.util.Iterator; importorg.apache.hadoop.conf.Configured; importorg.apache.hadoop.fs.Path; importo..
分类:其他好文   时间:2015-04-28 00:02:16    阅读次数:374
Hadoop安装备忘
参考刘鹏的《实战Hadoop》一书,按照hadoop0.20.2几个注意的地方。第一,首先理解Hadoop中的几个后台进程。NameNode,SecondaryNameNode,JobTracker,TaskTracker,DataNode这几个角色。NameNode:负责如何切分数据块,和切完放哪个节点。它对内存和I/O集中管理。这个进程部署在..
分类:其他好文   时间:2015-04-26 01:33:16    阅读次数:151
Hadoop中的Combiner实践
Combiner作用是合并Mapper的输出,Combiner的输出作为Reducer的输入,这样可以减少map任务和reducer任务之间的数据传输。1、在Job中设置Combiner和不设置Combiner,观察Reducer输入情况使用如下代码设置Combinerjob.setCombinerClass(MaxTemperatureReducer.class);@Override p..
分类:其他好文   时间:2015-04-24 16:33:08    阅读次数:143
495条   上一页 1 ... 31 32 33 34 35 ... 50 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!