码迷,mamicode.com
首页 >  
搜索关键字:分布式计算框架    ( 113个结果
hadoop
1. HADOOP背景介绍 1.1 什么是HADOOP Hadoop hive hbase flume kafka sqoop spark flink ……. 1.2 HADOOP产生背景 ——分布式文件系统(GFS),可用于处理海量网页的存储 ——分布式计算框架MAPREDUCE,可用于处理海量网 ...
分类:其他好文   时间:2018-09-05 11:39:05    阅读次数:195
HDFS你一定要知道,要考的
你肯定听过Hadoop,对就是那头奔跑的小象。 Hadoop作为大数据时代代表性的解决方案被大家所熟知,它主要包含两部分内容: HDFS分布式文件存储 MapReduce分a布式计算框架 前面我们分析存储方案的发展的时候有提到分布式文件存储的出现是为了解决存储的三大问题:可扩展性,高吞吐量,高可靠性 ...
分类:其他好文   时间:2018-08-23 02:14:30    阅读次数:159
做大数据分析研究的常用软件工具与其应用场景
做大数据分析研究的常用软件工具与其应用场景 实际进行大数据研究过程中,需要根据实际情况灵活选择最合适的工具(甚至多种工具组合使用),才能更好的完成研究探索。 如今,大数据日益成为研究行业的重要研究目标。面对其高数据量、多维度与异构化的特点,以及分析方法思路的扩展,传统统计工具已经难以应对。 工欲善其 ...
分类:其他好文   时间:2018-08-22 12:00:42    阅读次数:194
Ceph三连击之一:Ceph简介
之前我们介绍了HBase,并且实战了如何通过HBase+SpringBoot实战分布式文件存储,我们为什么要使用HBase来实现文件存储呢,究其原因还是因为HDFS本身具有一定的局限性。而且大多数的公司在使用Hadoop的时候一般只用到了它的MR部分(分布式计算框架),对于HDFS这个文件存储服务的 ...
分类:其他好文   时间:2018-08-07 18:54:10    阅读次数:177
打包项目,在本地使用
理解Hadoop2.7.4集群搭建组件: HDFS 海量数据的分布式存储 Map-Reduce 海量数据的分布式计算框架 Yarn 海量数据的资源管理 两个集群 逻辑上分离,物理上常在一起 1、Hdfs 集群 三个角色:Namenode,Datanod,Secondnode 2、Yarn集群 两个 ...
分类:其他好文   时间:2018-07-24 17:35:29    阅读次数:174
Linux 大数据(hadoop)
大数据是做什么的?大数据–随着计算机技术的发展,互联网的普及,信息的积累已经到了一个非常庞大的地步,信息的增长也在丌断的加快,随着互联网、物联网建设的加快,信息更是爆炸是增长,收集、检索、统计这些信息越发困难,必须使用新的技术来解决这些问题什么是大数据?大数据的定义–大数据由巨型数据集组成,这些数据集大小常超出人类在可接受时间下的收集、庋用、管理和处理能力。?大数据能做什么?–把数据集合幵后进行分
分类:系统相关   时间:2018-07-07 20:25:01    阅读次数:189
大数据实战项目必备技能三:storm
导读:Storm是一个分布式计算框架,主要使用Clojure与Java语言编写,最初是由NathanMarz带领Backtype公司团队创建,在Backtype公司被Twitter公司收购后进行开源。最初的版本是在2011年9月17日发行,版本号0.5.0。2013年9月,Apache基金会开始接管并孵化Storm项目。ApacheStorm是在EclipsePublicLicense下进行开发的
分类:其他好文   时间:2018-06-28 22:52:25    阅读次数:219
hadoop学习(一)概念理解
1.概念 1.1什么是hadoop? hadoop 是大数据存储和处理的框架,主要组成为文件存储系统hdfs和分布式计算框架mapreduce。 1.2能做什么,擅长做什么,不擅长做什么? 1.2.1能做什么,如何做? hadoop 支持处理TB,PB级别的文件。举个栗子:如100M的文件,过滤出含 ...
分类:其他好文   时间:2018-06-09 16:40:43    阅读次数:190
大数据技术(一)大数据软件框架
一、Hadoop框架 1.HDFS(分布式文件系统) 2.MapReduce(分布式计算框架) 3.YARN(集群资源管理器) 4.Zookeeper(分布式协作服务) 5.Ambari(管理工具) 二、Spark(内存计算框架) 1.Scala 2.Spark SQL 3.Spark Stream ...
分类:其他好文   时间:2018-05-18 11:28:00    阅读次数:137
hadoop学习笔记(八):MapReduce
一、MapReduce编程模型 一种分布式计算框架,解决海量数据的计算问题。 MapReduce将整个并行计算过程抽象到两个函数: Map(映射):对一些独立元素组成的列表的每一个元素进行制定的操作,可以高度并行。 Reduce(化简):对一个列表的元素进行合并。 一个简单的MapReduce程序只 ...
分类:其他好文   时间:2018-04-27 12:17:43    阅读次数:152
113条   上一页 1 2 3 4 5 6 ... 12 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!