码迷,mamicode.com
首页 >  
搜索关键字:hdfs dfsadmin    ( 4996个结果
07.HDFS Architecture
HDFS Architecture Introduction HDFS是分布式文件系统,它被设计为运行在普通商用硬件之上。它与已经存在的文件系统有很多相似性。但是,也有巨大的不同。HDFS有很高的容错,被设计为部署在低廉的硬件上。HDFS提供为应用程序的数据提供一个高通量的访问,适合有大量数据的应用程序。HDFS放松了一些POSIX的需求,以使可以用流的方式访问文件系统的数据。HDFS最初作为...
分类:其他好文   时间:2014-08-17 17:02:32    阅读次数:249
MapReduce剖析笔记之三:Job的Map/Reduce Task初始化
上一节分析了Job由JobClient提交到JobTracker的流程,利用RPC机制,JobTracker接收到Job ID和Job所在HDFS的目录,够早了JobInProgress对象,丢入队列,另一个线程从队列中取出JobInProgress对象,并丢入线程池中执行,执行JobInProgr...
分类:其他好文   时间:2014-08-17 03:45:51    阅读次数:383
hadoop的工作原理
hadoop是一种分布式系统的平台,通过它可以很轻松的搭建一个高效、高质量的分布系统,而且它还有许多其它的相关子项目,也就是对它的功能的极大扩充,包括Zookeeper,Hive,Hbase等。MapReduce是hadoop的核心组件之一,hadoop要分布式包括两部分,一是分布式文件系统hdfs,一部是..
分类:其他好文   时间:2014-08-17 01:11:02    阅读次数:241
hadoop高可靠
HDFS可靠性冗余副本策略机架策略心跳机制安全模式校验和回收站元数据保护在数据节点启动后,会把本地的文件系统遍历一次,产生一份数据块以及本地文件对应关系的清单叫做块报告,会汇报给NameNodeHadoop机架感知集群中各个节点之间会相互传递信息包心跳机制nameNode周期性从dat..
分类:其他好文   时间:2014-08-16 17:15:21    阅读次数:317
Hadoop的HDFS和Map/Reduce
HDFS HDFS是一个具有高度容错性的分布式文件系统,适合部署在廉价的机器上,它具有以下几个特点: 1)适合存储非常大的文件 2)适合流式数据读取,即适合“只写一次,读多次”的数据处理模式 3)适合部署在廉价的机器上 但HDFS不适合以下场景(任何东西都要分两面看,只有适合自己业务的技术才是真正的好技术): 1)不适合存储大量的小文件,因为受Namenode内...
分类:其他好文   时间:2014-08-14 16:46:28    阅读次数:260
HDFS Users Guide--官方文档
HDFS Users GuidePurposeOverviewPrerequisitesWeb InterfaceShell CommandsDFSAdmin CommandSecondary NameNodeCheckpoint NodeBackup NodeImport CheckpointRe...
分类:其他好文   时间:2014-08-14 16:36:20    阅读次数:244
HDFS Architecture--官方文档
HDFS ArchitectureIntroductionThe Hadoop Distributed File System (HDFS) is a distributed file system designed to run on commodity hardware. It has many...
分类:其他好文   时间:2014-08-14 16:23:38    阅读次数:275
HDFS Federation
HDFS联邦 本指南提供了一个HDFS联邦特性的综述,以及如何配置和管理联邦的集群。 背景 HDFS有两个主要的层次: 1.      Namespace a)        包含很多的目录,文件和block b)        他提供所有的文件系统操作像创建,删除,修改该和list文件和目录的命名空间 2.      Block Storage Service有两个部分 a)...
分类:其他好文   时间:2014-08-13 14:59:36    阅读次数:245
hadoop培训管理员认证
【课程内容】1、Hadoop分布式文件系统(HDFS)2、YARN/MapReduce的工作原理3、如何优化Hadoop机群所需要的硬件配置4、搭建Hadoop机群所需要考虑的网络因素5、Hadoop机群维护和控制6、如何利用Hadoop配置选项进行系统性能调优7、如何利用FairScheduler...
分类:其他好文   时间:2014-08-13 14:51:36    阅读次数:288
Hive运行架构及配置部署
Hive 运行架构 由Facebook开源,最初用于解决海量结构化的日志数据统计问题:ETL工具;    构建于Hadoop的HDFS和MapReduce智商,用于管理和查询结构化/非结构化数据的数据仓库;    设计目的是让SQL技能良好,但Java技能较弱的分析师可以查询海量数据:            使用HQL作为查询接口;            使用HDFS作为存储底层;...
分类:其他好文   时间:2014-08-12 19:05:44    阅读次数:314
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!