搜索关键字：hdfs dfsadmin，搜索到4996个结果！码迷,mamicode.com！

大数据开发：Hadoop配置

一、相关知识回顾分布式文件存储信息源：购买信息元（对海量数据清洗）自营提供（限于大公司）爬虫、抓包信息格式：文件、文本、sql、json 分布式计算离线批处理 MapReduce spark 实时数据流 storm spark Sqoop数据迁移：hdfs mysql flume数据上 ...

分类：其他好文时间：2020-02-19 10:28:03 阅读次数：94

大数据 hadoop ---- Sqoop、flume、chukwa

Sqoop 简介 Sqoop(发音：skup)是一款开源的工具，主要用于在Hadoop(Hive)与传统的数据库(mysql、postgresql...)间进行数据的传递，可以将一个关系型数据库（例如： MySQL ,Oracle ,Postgres等）中的数据导进到Hadoop的HDFS中，也可 ...

分类：Web程序时间：2020-02-18 12:47:15 阅读次数：149

Hadoop整体概述

目录前言 core-site.xml hdfs-site.xml mapred-site.xml yarn-site.xml 一、HDFS HDFS的设计理念 HDFS的缺点 1、NameNode 1.1、namenode的作用 1.2、元数据目录说明 1.3、NameNode启动 2、Secon ...

分类：其他好文时间：2020-02-18 09:58:41 阅读次数：100

HDFS简介及基本概念

（一）HDFS简介及其基本概念 HDFS（Hadoop Distributed File System）是hadoop生态系统的一个重要组成部分，是hadoop中的的存储组件，在整个Hadoop中的地位非同一般，是最基础的一部分，因为它涉及到数据存储，MapReduce等计算模型都要依赖于存储在HD ...

分类：其他好文时间：2020-02-15 18:47:15 阅读次数：65

hadoop Requested data length 86483783 is longer than maximum configured RPC length

错误： hadoop Requested data length 86483783 is longer than maximum configured RPC length 解决：修改NameNode的hdfs-site.xml配置文件，添加以下配置： <property> <name>ipc.m ...

分类：其他好文时间：2020-02-14 18:14:56 阅读次数：74

HIVE的一些关键内容解释说明

查询语言。由于 SQL 被广泛的应用在数据仓库中，因此，专门针对 Hive 的特性设计了类 SQL 的查询语言 HQL。熟悉 SQL 开发的开发者可以很方便的使用 Hive 进行开发。数据存储位置。Hive 是建立在 Hadoop 之上的，所有 Hive 的数据都是存储在 HDFS 中的。而数据库 ...

分类：其他好文时间：2020-02-13 22:35:19 阅读次数：73

Hadoop架构及集群

摘要：Hadoop是一个由Apache基金会所开发的分布式基础架构，Hadoop的框架最核心的设计就是：HDFS和MapReduce。HDFS为海量的数据提供了存储，而MapReduce则为海量的数据提供了计算，特点是：高可靠性，高扩展性，高效性，高容错性。l ...

分类：其他好文时间：2020-02-13 10:12:16 阅读次数：64

RDD编程--数据去重、求平均值

文件的存取都是在hdfs内完成（一）数据去重：程序：操作：结果：（二）求平均值程序：操作：结果： ...

分类：其他好文时间：2020-02-12 16:34:22 阅读次数：159

任务中如何确定spark分区数、task数目、core个数、worker节点个数、excutor数量

1、任务中如何确定spark RDD分区数、task数目、core个数、worker节点个数、excutor数量（1）hdfs 上的文件的存储形式是以 Block 的形式存储的，每个 File 文件都包含了很多块，一个Block默认是128M大小。当 spark 从 hdfs 上读取数据的时候，会 ...

分类：其他好文时间：2020-02-12 16:16:22 阅读次数：199

寒假记录十二

Sqoop概述 Sqoop是一款开源的工具，主要用于在Hadoop生态系统（Hadoop、Hive等)与传统的数据库(MySQL、Oracle等)间进行数据的传递，可以将一个关系型数据库中的数据导入到Hadoop的HDFS中，也可以将HDFS的数据导入到关系型数据库中。 Sqoop导入原理：在导入 ...

分类：其他好文时间：2020-02-12 14:33:53 阅读次数：82

共4996条上一页 1 ... 37 38 39 40 41 ... 500 下一页

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)