码迷,mamicode.com
首页 >  
搜索关键字:namenode hadoop    ( 14338个结果
HBase安装部署
实验环境 虚拟机数量:3 系统版本:Centos 7.5 Hadoop版本:Apache Hadoop 2.7.3 Zookeeper版本:Apache zookeeper-3.4.10. HBase版本:Apache HBase 1.2.6 1.启动Hadoop集群 在master启动Hadoop ...
分类:其他好文   时间:2020-06-10 11:05:53    阅读次数:63
15.HA高可用
一、HA概述 HA(High Available)即高可用(7*24小时不中断服务),实现高可用最关键的策略就是消除单点故障。HA严格地来说应该分成各个组件的HA机制,HDFS的HA和YARN的HA。 Hadoop2.0之前,在HDFS集群中NameNode存在单点故障(SPOF)。NameNode ...
分类:其他好文   时间:2020-06-10 10:58:31    阅读次数:72
今天的收获
jar包:是用java写的一些类 用的话直接用就不用再写了 。直接用jar包方便许多。 maven:是用jar包的时候只用下载一次就行了 ,下次再用就不用再下载一遍了。 编程似乎在不断完善 ,没有人知道未来是啥。 我在 写spark:是hadoop的完善。因为map和reduce不够用 。 spar ...
分类:其他好文   时间:2020-06-08 20:48:36    阅读次数:46
Mr与spark的shuffle过程详解及对比
恢复内容开始 大数据的分布式计算框架目前使用的最多的就是hadoop的mapReduce和Spark,mapReducehe和Spark之间的最大区别是前者较偏向于离线处理,而后者重视实现性,下面主要介绍mapReducehe和Spark两者的shuffle过程。 MapReduce的Shuffle ...
分类:其他好文   时间:2020-06-08 19:17:29    阅读次数:88
HDFS 和kerberos,浏览器配置
1、KDC 添加用户 ,输入密码 HTTP@HADOOP.COM 2、客户机(linux),kerberos客户端安装 3、客户机(linux),kerberos客户端配置 4、关闭客户机防火墙 systemctl stop firewalld.service 5、配置客户机host文件 6、客户机 ...
分类:其他好文   时间:2020-06-08 12:55:03    阅读次数:154
Flink Java踩坑记录(gegge1.10.0)
场景 使用Flink,从阿里云的AMQP中获取数据,然后直接写入到InfluxDB中。即: source:amqp sink:influxdb 环境 Linux:Centos8.0 Hadoop:2.8.3 Flink:1.10.0 Java:1.8.0_77 InfluxDB:1.7.1 Rock ...
分类:编程语言   时间:2020-06-08 10:48:29    阅读次数:55
乱谈马拉松和mapreduce的关系
做为一个业务马拉松爱好者和一个不太专业的IT从业者(十多年开发不会,业务略懂,没形成自己的价值体系,啥啥没心得,得过且过十几年),在马拉松的时候想到了这个对照关系。 那就随便写写,看到了博君一笑。 hadoop的map阶段,是通过transform操作,将数据进行转换,这个阶段数据都是在各个机器上, ...
分类:其他好文   时间:2020-06-08 00:39:55    阅读次数:61
在hadoop集群下启动hbase的方法
hbase已经配置好 开始使用hbase时 先启动hadoop集群 start-all.sh(前提是在bashrc中配置export PATH=$PATH:$HADOOP_HOME/sbin export PATH=$PATH:$HAOOP_HOME/bin) 然后start-hbase.sh,启动 ...
分类:其他好文   时间:2020-06-08 00:39:09    阅读次数:68
Hive的压缩存储和简单优化
一、Hive的压缩和存储 1,MapReduce支持的压缩编码 压缩格式 工具 算法 文件扩展名 是否可切分 对应的编码/解码器 DEFLATE 无 DEFLATE .deflate 否 org.apache.hadoop.io.compress.DefaultCodec Gzip gzip DEF ...
分类:其他好文   时间:2020-06-07 19:08:04    阅读次数:65
Centos7安装部署Hadoop集群
简介Hadoop是一个由Apache基金会所开发的分布式系统基础架构。用户可以在不了解分布式底层细节的情况下,开发分布式程序。充分利用集群的威力进行高速运算和存储。Hadoop实现了一个分布式文件系统(HadoopDistributedFileSystem),简称HDFS。HDFS有高容错性的特点,并且设计用来部署在低廉的(low-cost)硬件上;而且它提供高吞吐量(highthroughput
分类:其他好文   时间:2020-06-06 23:16:21    阅读次数:84
14338条   上一页 1 ... 41 42 43 44 45 ... 1434 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!