码迷,mamicode.com
首页 >  
搜索关键字:hdfs architecture    ( 6541个结果
MapReduce中Map数量的控制
InputFormat这个类是用来处理Map的输入数据的,任务开始时,InputFormat先将HDFS里所有输入文件里的数据分割成逻辑上的InputSpilt对象 这里的split是HDFS中block的部分或者一整块或几个快中的数据的逻辑分割,一个split对应于一个Map,所以Map的数量是由split的数量决定的。 那么怎样去确定InputSpilt的个数呢,下面列出于split个...
分类:其他好文   时间:2014-07-25 11:03:11    阅读次数:204
hadoop应用开发技术详解
《大 数据技术丛书:Hadoop应用开发技术详解》共12章。第1~2章详细地介绍了Hadoop的生态系统、关键技术以及安装和配置;第3章是 MapReduce的使用入门,让读者了解整个开发过程;第4~5章详细讲解了分布式文件系统HDFS和Hadoop的文件I/O;第6章分析了 MapReduce的工...
分类:其他好文   时间:2014-07-24 11:25:42    阅读次数:337
java管理hdfs文件的常用类小结
最近在写一些hadoop的运维工具,考虑到hadoop本身是java编写的,api比较方便,可以直接拿来就用准备用java来写。今天测试了几个fs相关的类。主要有FileStatus,FileSystem,DistributedFileSystem,DatanodeInfo,BlockLocationFileStatus是和文件的属性相关的类,比如文件的名称,..
分类:编程语言   时间:2014-07-24 10:49:36    阅读次数:303
02 Architecture Overview
本章提要---------------------------------------------arthiecture, and some componentconnect to oracle这一章, 概念性的东西多一些---------------------------------------...
分类:其他好文   时间:2014-07-23 20:36:45    阅读次数:288
什么是架构(Architecture)?
软件系统的架构将系统描述为计算组件及计算组件之间的交互。 —— Mary Shaw 软件体系结构:一门初露端倪学科的展望架构是以组件、组件之间的关系、组件与环境之间的关系为内容的某一系统的基本组织结构,以及指...
分类:其他好文   时间:2014-07-22 23:14:52    阅读次数:176
hbase首次导入大批次的数据成功!
本次主要是采用hbase自带的importtsv工具来导入。首先要把数据文件上传到hdfs上,然后导入hbase表格。该导入方式只支持.tsv数据文件的导入。导入流程:1.下载数据。我们在本文中将使用 “美国国家海洋和大气管理局 气候平均值”的公共数据集合。访问http://www1.ncdc.no...
分类:其他好文   时间:2014-07-22 22:36:13    阅读次数:406
利用QJM实现HDFS的HA策略部署与验证工作记录分享
1、概述Hadoop2.X中的HDFS(Vsersion2.0)相比于Hadoop1.X增加了两个重要功能,HA和Federation。HA解决了Hadoop1.XNamenode中一直存在的单点故障问题,HA策略通过热备的方式为主NameNode提供一个备用者,并且这个备用者的状态一直和主Namenode的元数据保持一致,一旦主NameNode挂..
分类:其他好文   时间:2014-07-22 14:55:35    阅读次数:365
FileAlreadyExistsException: Output directory hdfs://ubuntu:9000/output09 already exists
14/07/21 17:49:59 ERROR security.UserGroupInformation: PriviledgedActionException as:chenlongquan cause:org.apache.hadoop.mapred.FileAlreadyExistsException: Output directory hdfs://ubuntu:9000/output0...
分类:其他好文   时间:2014-07-22 14:38:19    阅读次数:179
用程序对hdfs进行操作。
调试加安装了半天,怎么也没有配置好怎么通过Eclipse直接连接hdfs,最后我还是打成一个jar包放到Linux虚拟机中执行的。 执行命令Java -jar  XXX.jar. 其中对hdfs的操作比较简单,主要就FileSystem这一个类,这个东西搞懂了,你对通过程序进行对hdfs的操作自然而然的也就非常熟练了。 下面我简单的举一个简单的从hdfs上读取文件内容的例子。大家分享一下。p...
分类:其他好文   时间:2014-07-21 22:32:08    阅读次数:217
Hadoop(1.2.1) 常用配置-------笔记
core-site.xml<configuration> <property> <name>fs.default.name</name> <value>hdfs://qlserver03:9000</value> </property> <property> <name>hadoop.tmp.dir</name> <value>/home/grid/hadoop/tmp</..
分类:其他好文   时间:2014-07-21 19:34:42    阅读次数:247
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!