搜索关键字：namenode hadoop，搜索到14338个结果！码迷,mamicode.com！

HBase安装部署

实验环境虚拟机数量：3 系统版本：Centos 7.5 Hadoop版本：Apache Hadoop 2.7.3 Zookeeper版本：Apache zookeeper-3.4.10. HBase版本：Apache HBase 1.2.6 1.启动Hadoop集群在master启动Hadoop ...

分类：其他好文时间：2020-06-10 11:05:53 阅读次数：63

15.HA高可用

一、HA概述 HA（High Available）即高可用（7*24小时不中断服务），实现高可用最关键的策略就是消除单点故障。HA严格地来说应该分成各个组件的HA机制，HDFS的HA和YARN的HA。 Hadoop2.0之前，在HDFS集群中NameNode存在单点故障（SPOF）。NameNode ...

分类：其他好文时间：2020-06-10 10:58:31 阅读次数：72

今天的收获

jar包：是用java写的一些类用的话直接用就不用再写了。直接用jar包方便许多。 maven：是用jar包的时候只用下载一次就行了，下次再用就不用再下载一遍了。编程似乎在不断完善，没有人知道未来是啥。我在写spark：是hadoop的完善。因为map和reduce不够用。 spar ...

分类：其他好文时间：2020-06-08 20:48:36 阅读次数：46

Mr与spark的shuffle过程详解及对比

恢复内容开始大数据的分布式计算框架目前使用的最多的就是hadoop的mapReduce和Spark，mapReducehe和Spark之间的最大区别是前者较偏向于离线处理，而后者重视实现性，下面主要介绍mapReducehe和Spark两者的shuffle过程。 MapReduce的Shuffle ...

分类：其他好文时间：2020-06-08 19:17:29 阅读次数：88

HDFS 和kerberos，浏览器配置

1、KDC 添加用户，输入密码 HTTP@HADOOP.COM 2、客户机（linux），kerberos客户端安装 3、客户机（linux），kerberos客户端配置 4、关闭客户机防火墙 systemctl stop firewalld.service 5、配置客户机host文件 6、客户机 ...

分类：其他好文时间：2020-06-08 12:55:03 阅读次数：154

Flink Java踩坑记录（gegge1.10.0）

场景使用Flink，从阿里云的AMQP中获取数据，然后直接写入到InfluxDB中。即： source：amqp sink：influxdb 环境 Linux：Centos8.0 Hadoop：2.8.3 Flink：1.10.0 Java：1.8.0_77 InfluxDB：1.7.1 Rock ...

分类：编程语言时间：2020-06-08 10:48:29 阅读次数：55

乱谈马拉松和mapreduce的关系

做为一个业务马拉松爱好者和一个不太专业的IT从业者（十多年开发不会，业务略懂，没形成自己的价值体系，啥啥没心得，得过且过十几年），在马拉松的时候想到了这个对照关系。那就随便写写，看到了博君一笑。 hadoop的map阶段，是通过transform操作，将数据进行转换，这个阶段数据都是在各个机器上， ...

分类：其他好文时间：2020-06-08 00:39:55 阅读次数：61

在hadoop集群下启动hbase的方法

hbase已经配置好开始使用hbase时先启动hadoop集群 start-all.sh(前提是在bashrc中配置export PATH=$PATH:$HADOOP_HOME/sbin export PATH=$PATH:$HAOOP_HOME/bin) 然后start-hbase.sh，启动 ...

分类：其他好文时间：2020-06-08 00:39:09 阅读次数：68

Hive的压缩存储和简单优化

一、Hive的压缩和存储 1，MapReduce支持的压缩编码压缩格式工具算法文件扩展名是否可切分对应的编码/解码器 DEFLATE 无 DEFLATE .deflate 否 org.apache.hadoop.io.compress.DefaultCodec Gzip gzip DEF ...

分类：其他好文时间：2020-06-07 19:08:04 阅读次数：65

Centos7安装部署Hadoop集群

简介Hadoop是一个由Apache基金会所开发的分布式系统基础架构。用户可以在不了解分布式底层细节的情况下，开发分布式程序。充分利用集群的威力进行高速运算和存储。Hadoop实现了一个分布式文件系统（HadoopDistributedFileSystem），简称HDFS。HDFS有高容错性的特点，并且设计用来部署在低廉的（low-cost）硬件上；而且它提供高吞吐量（highthroughput

分类：其他好文时间：2020-06-06 23:16:21 阅读次数：84

共14338条上一页 1 ... 41 42 43 44 45 ... 1434 下一页

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)