码迷,mamicode.com
首页 >  
搜索关键字:hdfs dfsadmin    ( 4996个结果
大数据开发:Hadoop配置
一、相关知识回顾 分布式文件存储 信息源: 购买信息元(对海量数据清洗) 自营提供(限于大公司) 爬虫、抓包 信息格式:文件、文本、sql、json 分布式计算 离线批处理 MapReduce spark 实时数据流 storm spark Sqoop数据迁移:hdfs mysql flume数据上 ...
分类:其他好文   时间:2020-02-19 10:28:03    阅读次数:94
大数据 hadoop ---- Sqoop、flume、chukwa
Sqoop 简介 Sqoop(发音:skup)是一款开源的工具,主要用于在Hadoop(Hive)与传统的数据库(mysql、postgresql...)间进行数据的传递,可以将一个关系型数据库(例如 : MySQL ,Oracle ,Postgres等)中的数据导进到Hadoop的HDFS中,也可 ...
分类:Web程序   时间:2020-02-18 12:47:15    阅读次数:149
Hadoop整体概述
目录 前言 core-site.xml hdfs-site.xml mapred-site.xml yarn-site.xml 一、HDFS HDFS的设计理念 HDFS的缺点 1、NameNode 1.1、namenode的作用 1.2、元数据目录说明 1.3、NameNode启动 2、Secon ...
分类:其他好文   时间:2020-02-18 09:58:41    阅读次数:100
HDFS简介及基本概念
(一)HDFS简介及其基本概念 HDFS(Hadoop Distributed File System)是hadoop生态系统的一个重要组成部分,是hadoop中的的存储组件,在整个Hadoop中的地位非同一般,是最基础的一部分,因为它涉及到数据存储,MapReduce等计算模型都要依赖于存储在HD ...
分类:其他好文   时间:2020-02-15 18:47:15    阅读次数:65
hadoop Requested data length 86483783 is longer than maximum configured RPC length
错误: hadoop Requested data length 86483783 is longer than maximum configured RPC length 解决: 修改NameNode的hdfs-site.xml配置文件,添加以下配置: <property> <name>ipc.m ...
分类:其他好文   时间:2020-02-14 18:14:56    阅读次数:74
HIVE的一些关键内容解释说明
查询语言。由于 SQL 被广泛的应用在数据仓库中,因此,专门针对 Hive 的特性设计了类 SQL 的查询语言 HQL。熟悉 SQL 开发的开发者可以很方便的使用 Hive 进行开发。 数据存储位置。Hive 是建立在 Hadoop 之上的,所有 Hive 的数据都是存储在 HDFS 中的。而数据库 ...
分类:其他好文   时间:2020-02-13 22:35:19    阅读次数:73
Hadoop架构及集群
摘要:Hadoop是一个由Apache基金会所开发的分布式基础架构,Hadoop的框架最核心的设计就是:HDFS和MapReduce。HDFS为海量的数据提供了存储,而MapReduce则为海量的数据提供了计算,特点是:高可靠性,高扩展性,高效性,高容错性。l ...
分类:其他好文   时间:2020-02-13 10:12:16    阅读次数:64
RDD编程--数据去重、求平均值
文件的存取都是在hdfs内完成 (一)数据去重: 程序: 操作: 结果: (二)求平均值 程序: 操作: 结果: ...
分类:其他好文   时间:2020-02-12 16:34:22    阅读次数:159
任务中如何确定spark分区数、task数目、core个数、worker节点个数、excutor数量
1、任务中如何确定spark RDD分区数、task数目、core个数、worker节点个数、excutor数量 (1)hdfs 上的文件的存储形式是以 Block 的形式存储的,每个 File 文件都包含了很多块,一个Block默认是128M大小。当 spark 从 hdfs 上读取数据的时候,会 ...
分类:其他好文   时间:2020-02-12 16:16:22    阅读次数:199
寒假记录十二
Sqoop概述 Sqoop是一款开源的工具,主要用于在Hadoop生态系统(Hadoop、Hive等)与传统的数据库(MySQL、Oracle等)间进行数据的传递,可以将一个关系型数据库中的数据导入到Hadoop的HDFS中,也可以将HDFS的数据导入到关系型数据库中。 Sqoop导入原理: 在导入 ...
分类:其他好文   时间:2020-02-12 14:33:53    阅读次数:82
4996条   上一页 1 ... 37 38 39 40 41 ... 500 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!