码迷,mamicode.com
首页 >  
搜索关键字:hdfs 元数据管理    ( 5040个结果
linux之hadoop
hadoop架构 MapReduce:分布式计算架构 HDFS:分布式文件系统 YARN:集群资源管理系统 HDFS结构: hadoop单机模式 搭建步骤: 搭建四台服务器,分别为:server、node1、node2、node3 1、关闭防火墙和selinux 2、保证server到每一个node ...
分类:系统相关   时间:2019-10-24 00:31:59    阅读次数:104
数据仓库分层架构
数据层的存储一般如下: Data Source 数据源一般是业务库和埋点,当然也会有第三方购买数据等多种数据来源方式。业务库的存储一般是Mysql 和 PostgreSql。 ODS 层 ODS 的数据量一般非常大,所以大多数公司会选择存在HDFS上,即Hive或者Hbase,Hive居多。 可将O ...
分类:其他好文   时间:2019-10-22 13:07:13    阅读次数:124
大数据Hadoop相关基本概念
大数据特征(5V) Velocity(快速的数据流转) Veracity(精准可信赖的大数据) Variety(多样的数据类型) Volume(海量的数据规模) Value(数据价值密度相对较低) 大数据架构 HDFS服务功能 NameNode NameNode是主节点,存储文件的元数据,如文件名, ...
分类:其他好文   时间:2019-10-21 16:21:39    阅读次数:104
Hadoop学习(五)-MapReduce架构原理
概述hadoop主要是用于应对海量数据的存储和计算的,前面hdfs文件系统,则重点是用于海量数据的存储。那么有了这么多数据,我们又该怎么在这些数据里面来提取我们需要的信息呢?这个时候hadoop中出现了一个非常重要的成员MapReduce。MapReduce是一种编程模型,用于大规模数据集(大于1T... ...
分类:其他好文   时间:2019-10-21 00:07:46    阅读次数:95
Permission denied: user=root, access=WRITE, inode="/":hdfs:supergroup:drwxr-xr-x
通过手动安装CDH没权限 [root@slave1 ~]# groupadd supergroup[root@slave1 ~]# hadoop fs -mkdir /tao3^C[root@slave1 ~]# usermod -a -G supergroup root[root@slave1 ~ ...
分类:数据库   时间:2019-10-20 12:35:51    阅读次数:186
spark error Caused by: java.io.NotSerializableException: org.apache.hadoop.hdfs.DistributedFileSystem
序列化问题多事rdd遍历过程中使用了没有序列化的对象。 1.将未序列化的变量定义到rdd遍历内部。如定义入数据库连接池。 2.常量定义里包含了未序列化对象 ,提出去吧 如下常量要放到main里,不能放到rdd的遍历中。 ...
分类:编程语言   时间:2019-10-18 18:57:19    阅读次数:132
十、HDFS的namenode工作机制
[TOC]一、fsimage和edits文件1、基本概念txid:namenode对每个操作事件(增删改操作)都给了一个唯一的id标识,称为txid,一般是从0开始自增,每多一个操作,txid就自增1。fsimage:是namenode在内存中的元数据在本地磁盘的一个镜像文件,但是通常情况fsimage并没有包含自新的操作事件,所以本质上和内存中元数据还是有差距的。这里记录的不是操作日志,其中包含
分类:其他好文   时间:2019-10-16 23:06:53    阅读次数:159
datax
datax DataX 是一个异构数据源离线同步工具,致力于实现包括关系型数据库(MySQL、Oracle等)、HDFS、Hive、ODPS、HBase、FTP等各种异构数据源之间稳定高效的数据同步功能。 Github项目链接: "Github datax" 简介参考: "CNSD datax简介" ...
分类:其他好文   时间:2019-10-15 10:05:37    阅读次数:86
Flink源码阅读(一)——Flink on Yarn的Per-job模式源码简析
一、前言 个人感觉学习Flink其实最不应该错过的博文是Flink社区的博文系列,里面的文章是不会让人失望的。强烈安利:https://ververica.cn/developers-resources/。 本文是自己第一次尝试写源码阅读的文章,会努力将原理和源码实现流程结合起来。文中有几个点目前也 ...
分类:其他好文   时间:2019-10-15 09:54:49    阅读次数:571
五、通过API操作hdfs
一、基本api操作1、获取HDFS对象的两种方式:方式1:publicstaticFileSysteminitFileSystem1()throwsIOException{//获取配置对象Configurationconf=newConfiguration();//指定namenode地址conf.set("fs.defaultFS","hdfs://bigdata121:9000");//获取h
分类:Windows程序   时间:2019-10-14 19:54:00    阅读次数:150
5040条   上一页 1 ... 59 60 61 62 63 ... 504 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!