猫场面试题第 1 套 以下为我为大家整理的猫场面试题第一套,均为笔者自己参加面试或者一些读者分享给我的题目,保证真实和准确性。 1 框架部分 1.1 Spark 提交 job 流程 所谓提交流程,其实就是我们开发人员根据需求写的应用程序通过 Spark 客户端提交给 Spark 运行环境执行计算的流 ...
分类:
其他好文 时间:
2020-10-13 17:19:39
阅读次数:
26
NameNode运行时元数据需要存放在内存中,同时在磁盘中备份元数据的fsImage,当元数据有更新或者添加元数据时,修改内存中的元数据会把操作记录追加到edits日志文件中,这里不包括查询操作。如果NameNode节点发生故障,可以通过FsImage和Edits的合并,重新把元数据加载到内存中,此时SecondaryNameNode专门用于fsImage和edits的合并。
分类:
其他好文 时间:
2020-10-12 20:32:44
阅读次数:
26
vmware16.0 centos7.8 1. 使用vmware安装 centos环境 cpu4个 内存4G 网络nat模式 2.配置网络 vim /etc/sysconfig/network-scripts/ifcfg-ens33 TYPE="Ethernet" PROXY_METHOD="non ...
分类:
其他好文 时间:
2020-10-10 17:16:23
阅读次数:
31
1.集群的数据迁移 在工作中经常会遇到redis集群的扩容的场景,因为当一个集群服务器中的内存不够用无法支撑更大数据量的缓存或者并发量不够(个人理解),就会将原有的集群扩展。集群扩容需要将集群中原有的master节点上的槽位以及数据迁移到新加入的master节点上。 每个槽都把要里面的数据迁移完才能 ...
分类:
其他好文 时间:
2020-10-09 21:40:42
阅读次数:
46
个推运维平台高级网络工程师山川随着互联网公司规模的扩大,企业对成本控制和数据安全的需求越来越高,大部分公司往往会自建机房,而非租用云服务器。个推在互联网数据中心(InternetDataCenter,简称IDC)网络规划和运营方面也经历了几次的迭代和变迁,同时,我们也对数据中心网络发展的历程进行了总结。我们将围绕IDC网络运营规划的基本要求、传统PC时代的网络架构、移动互联网和大数据时代的IDC网
分类:
其他好文 时间:
2020-10-09 21:23:35
阅读次数:
21
hadoop安装 1. 安装jdk a.复制jdk-xx.tar.gz 到~Downloads b.解压 c. 移动到/soft ; 创建软连接ln -s /soft/jdk-xxx jdk d.配置环境变量 [/etc/enviroment] JAVA_HOME=/soft/jdk PATH=". ...
分类:
其他好文 时间:
2020-10-09 21:22:17
阅读次数:
27
<repositories> <repository> <id>hadoop</id> <url>https://repository.cloudera.com/artifactory/cloudera-repos</url> </repository> <dependency> <groupId> ...
分类:
其他好文 时间:
2020-10-08 19:30:36
阅读次数:
21
不看就亏系列!这里有完整的 Hadoop 集群搭建教程,和最易懂的 Hadoop 概念!| 附代码
分类:
其他好文 时间:
2020-10-08 18:37:04
阅读次数:
25
大数据是指无法在一定时间范围内用常规软件工具进行处理和分析的数据集合,需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能的海量、高增长率和多样性的信息资产
分类:
其他好文 时间:
2020-10-08 18:36:53
阅读次数:
17