码迷,mamicode.com
首页 >  
搜索关键字:datanode    ( 857个结果
HBase与Hive
二者对比 1.Hive 数据仓库:本质其实就相当于将hdfs中已经存储的文件在Mysql中做了一个双射关系,以方便用HQL去管理查询。 用于数据分析、清洗:Hive适用于离线的数据分析和清洗,延迟较高。 基于HDFS、MapReduce:Hive存储的数据依旧在DataNode上,编写的HQL语句终 ...
分类:其他好文   时间:2020-05-09 01:23:51    阅读次数:63
从Hadoop HA到Zookeeper到Kafka(了解篇)
Kafka基于Zookeeper协调的分布式日志系统,可以当做MQ。主要就是做:日志收集系统、消息系统。还有就是用于用户活动跟踪:记录web用户或者app用户的各种活动,相信大家都感受到了吧。上篇我们已经提到,消息系统的两种传递模式:点对点、订阅/发布。这里将不再赘述。【对比】名称Column2RabbitMQ使用Erlang编写的一个开源的消息队列,适合企业级的开发,同时实现了Broker构架,
分类:其他好文   时间:2020-05-08 09:42:36    阅读次数:66
一、hadoop基本介绍
1.Hadoop的整体框架 Hadoop是由许多元素构成的,最核心的是HDFS(分布式文件系统),它存储了Hadoop集群中所有DataNode文件,HDFS的上一层是MapReduce引擎,MapReduce是一种计算模型,用以进行大数据量的计算。 HDFS HDFS是Hadoop项目的核心子项目 ...
分类:其他好文   时间:2020-04-27 13:27:50    阅读次数:70
centos7安装hbase集群
安装前准备: 首先,要有一个HDFS集群,并正常运行; regionserver应该跟hdfs中的datanode在一起 其次,还需要一个zookeeper集群,并正常运行 然后,安装HBASE 开始安装hbase集群 1.解压安装包 tar -zvxf hbase-1.2.1-bin.tar.gz ...
分类:其他好文   时间:2020-04-18 18:35:01    阅读次数:74
Hadoop--介绍
1。hadoop生态系统 2.Hadoop分布式文件系统 2.1 HDFS的设计 2.2 HDFS的概念 数据块 namenode和datanode HDFS的高可用性 2.3命令行接口 2.4hadoop文件系统 2.5通过Flume和sqoop导入数据 ...
分类:其他好文   时间:2020-04-09 15:30:24    阅读次数:92
CDH平台规划注意事项
1.1 业务数据全部存储在datanode上面,所以datanode的存储空间必须足够大,且每个datanode的存储空间尽量保持一致。1.2 管理节点/namenode对存储空间要求不高,主要存储各计算节点datanode的元数据信息,以3个datanode为例,每个datanode存储2T的数据... ...
分类:其他好文   时间:2020-03-27 23:28:42    阅读次数:150
hadoop完全分布式搭建部署
1 环境准备 1.1 修改IP 1.2 修改主机名及主机名和IP地址的映射 1.3 关闭防火墙 1.4 ssh免密登录 1.5 安装JDK,配置环境变量 2 集群规划 节点名称 NN JJN DN ZKFC ZK RM NM linux1 NameNode JournalNode DataNode ...
分类:其他好文   时间:2020-03-24 15:39:44    阅读次数:82
hadoop-HDFS的数据流
HDFS写数据流程 1.客户端通过Distributed FileSystem模块向NameNode请求上传文件,NameNode检查目标文件是否已经存在,父目录是否存在; 2.NameNode返回是否可以上传文件; 3.客户端请求一个block上传到指定的那个DataNode服务器上; 4.Nam ...
分类:其他好文   时间:2020-03-20 19:52:48    阅读次数:56
Hadoop生态中各个组件、进程的作用
1、hadoop的各种进程及其作用 NameNode:是hdfs的主服务器,管理文件系统的目录树以及对集群中存储文件的访问,保存有metadate,不断读取记录集群中dataNode主机状况和工作状态。 SecondaryNameNode:NameNode的冷备,负责周期性的合并esimage以及e ...
分类:系统相关   时间:2020-03-18 18:46:10    阅读次数:66
DataNode
一:DataNode工作机制 (1)一个数据块在DataNode上以文件形式存储在磁盘上,包括两个文件,一个是数据本身,一个是元数据包括数据块的长度、 快数据的校验和(验证数据完整性)以及时间戳 (2)DataNode启动后向NameNode注册,通过后,周期性(1小时)的向NameNode上报所有 ...
分类:其他好文   时间:2020-03-15 22:22:33    阅读次数:80
857条   上一页 1 2 3 4 5 6 ... 86 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!