最近,我在学习搭建hadoop集群,可是搭建完成后当使用start-all.sh启动hadoop的时候,会发现用jps测试的时候一切均显示正常,但通过Hadoop指令向hdfs上传输文件的时候,会报错表示datanode没有正常启动, 在网上找了一些博客讲述是可能防火墙没关,还有就是删除hadoop ...
分类:
其他好文 时间:
2019-09-16 11:55:30
阅读次数:
95
Hive理论1、Hive是什么?一个sql解析引擎,将SQL解析成MR,Hive本质就是MR2、Hive不存数据的,数据实际存在HDFS上,元数据基本上都存在mysql上3、Hive内容是读多写少,不支持数据的改写和删除4、Hive的SQL和传统SQL区别: 可扩展性:用户自定义函数 1)UDF:用 ...
分类:
其他好文 时间:
2019-09-15 17:10:25
阅读次数:
110
secondary namenode NameNode职责是管理元数据信息,DataNode的职责是负责数据具体存储,那么SecondaryNameNode的作用是什么?对很多初学者来说是非常迷惑的。它为什么会出现在HDFS中。从它的名字上看,它给人的感觉就像是NameNode的备份。但它实际上却不 ...
分类:
其他好文 时间:
2019-09-14 22:47:38
阅读次数:
139
伪分布式环境: HA环境checkpoint机制 配置了HA的HDFS中,有active和standby namenode两个namenode节点。他们的内存中保存了一样的集群元数据信息,因为standby namenode已经将集群状态存储在内存中了,所以创建检查点checkpoint的过程只需要 ...
分类:
其他好文 时间:
2019-09-14 22:23:28
阅读次数:
122
介绍:<!--more--> HDFS (Hadoop Distributed File System)是 Hadoop 下的分布式文件系统,具有高容错、高吞吐量等特性,可以部署在低成本的硬件上。 HDFS 设计原理 HDFS 架构 HDFS 遵循主/从架构,由单个 NameNode(NN) 和多个 ...
分类:
其他好文 时间:
2019-09-14 19:38:43
阅读次数:
162
1、hive抓取策略 hive.fetch.task.conversion = more/none more不走mr,none走mr 2、explain 显示执行计划 3、设置本地运行模式 set hive.exec.mode.local.auto = true hive.exec.mode.loc ...
分类:
其他好文 时间:
2019-09-14 10:20:34
阅读次数:
98
1.hadoop1.x和hadoop2.x区别 2.组件介绍 HDFS架构概述1)NameNode(nn): 存储文件的元数据,如文件名,文件目录结构,文件属性(生成时间,副本数,文件权限),以及每个文件的块列表和块所在的DataNode等.2)DataNode(dn): 在本地文件系统存储文件块数 ...
分类:
其他好文 时间:
2019-09-13 15:50:23
阅读次数:
112
Hive数据导入方式,Hive数据导出方式。hive,hdfs数据
分类:
其他好文 时间:
2019-09-13 11:32:35
阅读次数:
123
一、概要 这篇文章,给大家聊聊分布式文件系统HDFS在大量客户端并发写数据时,如何进行性能优化? 二、背景引入 先引入一个小的背景,假如多个客户端同时要并发的写Hadoop HDFS上的一个文件,这个事儿能成吗? 明显不可以接受啊,因为HDFS上的文件是不允许并发写的,比如并发的追加一些数据什么。 ...
分类:
编程语言 时间:
2019-09-12 16:21:02
阅读次数:
80