码迷,mamicode.com
首页 > 其他好文 > 详细

大数据Hadoop基础入门到精通

时间:2019-08-16 00:34:16      阅读:122      评论:0      收藏:0      [点我收藏+]

标签:基础   合并   fat32   linu   name   基础入门   lin   入门   mapr   

1.hadoop前世今生:

  1) 搜索引擎:网络爬虫+索引服务器(生成索引+检索)

  2) Doung Cutting

  3)  Nutch

    a.分布式存储

    b.分布式计算

  4)GFS论文 doung cutting写了hdfs

2.hadoop概述

  hadoop common:提供网络通信

  hadoop hdfs

  hadoop mapreduce

  hadoop yarn

 

Hadoop 0.x 1.x

 

 

 

技术图片

 

 Hadoop 2.x之后的版本

 Hadoop 概述

 

技术图片

 

hdfs引入 

技术图片

 

NameNode是主节点存储元数据,以及每个文件所在的块列表和块所在的DataNode

 

DataNode存储块数据和校验和

 

SecondaryNamenode 监控后台数据,获取快照

 

 

1)四大模块

 

2)hdfs(hadoop distributed file system):分布式文件系统

  a.文件系统:文件管理+block块管理

  单机文件系统

  window:FAT16、FAT32、NTFS

  linux:ext 2/3/4、 VFS

  b.分布式文件系统

  多个服务器文件系统

  c.三大组件

  NameNode

  •   元数据:文件名、目录名、属性
  •   文件列表与block列表之间的关系
  •   block与datanode列表映射关系

 

  Datanode

  block块数据、校验和编码

 

  SecondaryNameNode

  分担namenode压力,合并编辑日志edits和镜像文件fsimage,合并后将最终的文件返回namenode进行处理

  

 Hadoop概述

 

技术图片

YARN引入案例

 

大数据Hadoop基础入门到精通

标签:基础   合并   fat32   linu   name   基础入门   lin   入门   mapr   

原文地址:https://www.cnblogs.com/zhichun/p/11361255.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!