搜索关键字：hdfs 元数据管理，搜索到5040个结果！码迷,mamicode.com！

HDFS 客户端读写操作详情

1. 读操作 1. 客户端向namenode发起上传请求 2. namenode检查datanode是否已经存有该文件，并且检查客户端的权限 3. 确认可以上传后，根据文件块数返回datanode栈注：namenode触发副本放置策略，如果客户端在集群内的某一台机器，那么副本第一块放置在该服务器上 ...

分类：其他好文时间：2020-03-01 12:13:26 阅读次数：64

HBase简单介绍

HBase是Hadoop的一个子项目，用JAVA语言实现，是建立在HDFS的基础上的非关系型分布式数据库，目标是通过水平扩展的方式处理非常庞大的表。值得注意的是，HBase并非结构化数据库，而是介于非关系型数据库（nosql）与关系型数据库（RDBMS）之间，仅能存储非结构化数据和半结构化数据。为 ...

分类：其他好文时间：2020-03-01 00:09:42 阅读次数：63

Spark

1、什么是Spark Spark是一种统一、快速、通用、可扩展的分布式大数据分析引擎。分布式体现在Spark一般情况是以集群模式存在，架构为Master/Slaver(主从结构)。大数据分析引擎体现在Spark能够分析数据，但是没有存储。一般线上的spark数据来源（HDFS, Hive、Kafk ...

分类：其他好文时间：2020-02-29 20:51:19 阅读次数：74

向hdfs上传文件，运行程序，查看结果

1.建立目录 hdfs dfs -mkdir -p /data/wc/input 2.上传文件 hdfs dfs -D dfs.blocksize=1048576 -put /setup/data.txt /data/wc/input 3.进入运行程序所在目录 cd /software/hadoop ...

分类：Web程序时间：2020-02-29 20:49:02 阅读次数：127

大数据 03 HDFS

JobTracker 分配工作给若干机器. TaskTracker: 负责监督光纤交换机. 块的概念: 一个块 64M. 还可以是 128M. 大文件切割成这种小块, 然后分布存储在不同机器上. 当然也可以并行处理. 名称节点: 整个 HDFS 集群管家, 负责元数据的存储. (index 数据块 ...

分类：其他好文时间：2020-02-29 13:14:19 阅读次数：78

1，Hadoop知识储备

Hadoop初学思维导图 1，Hadoop ··· Hadoop： Hadoop的核心由HDFS和MapReduce组成。HDFS是分布式文件系统，是Hadoop生态圈的分布式数据存储基石；MapReduce是计算组件，会被Spark取代。 ··· Hadoop生态圈： Hadoop生态圈是一系列用 ...

分类：其他好文时间：2020-02-29 00:17:31 阅读次数：101

hadoop搭建HA集群之后不能自动切换namenode

在搭好HA集群之后，想测试一下集群的高可用性，于是先把active的namenode给停掉： hadoop-daemon.sh stop namenode 或者直接kill掉该节点namenode的对应进程也可。但是通过hdfs haadmin -getServiceState master1 查 ...

分类：其他好文时间：2020-02-28 18:52:26 阅读次数：101

[大数据技术]datax的安装以及使用

1、datax简述 DataX 是阿里巴巴集团内被广泛使用的离线数据同步工具/平台，实现包括 MySQL、Oracle、SqlServer、Postgre、HDFS、Hive、ADS、HBase、TableStore(OTS)、MaxCompute(ODPS)、DRDS 等各种异构数据源之间高效的数 ...

分类：其他好文时间：2020-02-27 20:52:31 阅读次数：264

hadoop HDFS扩容

1.纵向扩容（添加硬盘） 1.1 添加硬盘确定完成添加，运行 lsblk 查看硬盘使用情况 1.2 硬盘分区 centerOS7的默认文件系统是xfs，centerOS6默认的文件系统是ext4 1.3 挂载 mount 分的区被挂载的文件夹注：umount /dev/sdb1 /sdb1 取 ...

分类：其他好文时间：2020-02-26 19:03:30 阅读次数：85

java.io.IOException: All specified directories have failed to load.

java.io.IOException: All specified directories have failed to load. at org.apache.hadoop.hdfs.server.datanode.DataStorage.recoverTransitionRead(DataSt ...

分类：编程语言时间：2020-02-26 01:13:41 阅读次数：90

共5040条上一页 1 ... 35 36 37 38 39 ... 504 下一页

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)