码迷,mamicode.com
首页 > 其他好文 > 详细

假期学习——大数据的初步认识

时间:2021-07-09 17:52:26      阅读:0      评论:0      收藏:0      [点我收藏+]

标签:容错   load   secondary   优势   概念   计算   没有   inf   高效   

今天学习了大数据的一些基本的概念。

什么是Hadoop:

技术图片

 

 大数据主要还是解决海量数据的存储和海量数据的分析计算。

大数据的特点:大量、高效、多样(结构化数据和非结构化数据)、低价值密度。

Hadoop的三大发行版本:

Apache、cloundera、hortonworks。

当然现在cloundera收购了hortonworks(准确来说算是强强联合吧),Apache入门学习最好。

Hadoop的优势:

Hadoop有四个优势

高可靠性、高扩展性、高效性、高容错性。

Hadoop的组成:

Hadoop1.x主要是MapReduce(负责计算和资源调度)这时还没有yarn、hdfs(数据存储)、common(辅助工具)。

Hadoop2.x和Hadoop3.x在组成上没太大区别:MapReduce(计算)、yarn(资源调度)、hdfs(数据存储)、common(辅助工具)

HDFS的概述:

其中主要包括namenode(nn)、DataNode(dn)、secondary namanode(2nn)

技术图片

 

 这就是今天初步学习的一些大数据知识。

假期学习——大数据的初步认识

标签:容错   load   secondary   优势   概念   计算   没有   inf   高效   

原文地址:https://www.cnblogs.com/haobox/p/14988181.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!