Hadoop 02 核心介绍 1. HDFS HDFS(Hadoop Distributed File System) 是一个 Apache Software Foundation 项目, 是 Apache Hadoop 项目的一个子项目. Hadoop 非常适于存储大型数据 (比如 TB 和 PB ...
分类:
其他好文 时间:
2020-03-27 11:15:08
阅读次数:
64
微软在Ignite2019大会上正式发布了新一代数据库产品SQLServer2019。使用统一的数据平台实现业务转型SQLServer2019附带ApacheSpark和HadoopDistributedFileSystem(HDFS),可实现所有数据的智能化。SQLServer2019的亮点SQLServer是数据集成的中心。通过SQLserver和Spark为结构化和非结构化数据提供转型洞察力
分类:
数据库 时间:
2020-03-26 10:48:50
阅读次数:
131
1、代码管理-->主要开源方案有gitlab、gerrit+repo、gogs 2、任务执行-->jenkins 3、自动化测试-->python 4、构件存储-->hdfs、nexus 5、日志管理-->ELK 6、部署工具-->ansible 7、系统集群高可用-->k8s 8、监控-->zab ...
分类:
其他好文 时间:
2020-03-26 01:39:44
阅读次数:
193
Hbase架构原理解析 https://developer.51cto.com/art/201904/595698.htm HBase 架构 HBase 的架构似乎也是 master-slave 架构,和 HDFS 有点像,HMaster 是用来管理集群,HRegionServer 是真正存储数据的 ...
分类:
其他好文 时间:
2020-03-26 01:03:42
阅读次数:
70
1.名称配额 (*)Hadoop分布式文件系统( HDFS )允许管理员为使用的名字(name)数量和用于各个目录的空间设置配额。名字配额和空间配额独立运行,但两种类型配额的管理和实施密切平行。 名称配额是对以该目录为根的树中文件和目录名称数量的硬限制。如果超过配额,创建文件和目录将会失败。配额与重 ...
分类:
其他好文 时间:
2020-03-23 15:29:01
阅读次数:
85
原文链接: https://www.toutiao.com/i6772128429614563843/ 首先我们已经安装好sqoop了,如果没有安装好参考文档《快速搭建CDH-Hadoop-Hive-Zoopkeeper-Sqoop环境进入Sqoop学习环境》 准备一些基本的认识 1、sqoop分为 ...
分类:
其他好文 时间:
2020-03-21 00:07:30
阅读次数:
68
HDFS写数据流程 1.客户端通过Distributed FileSystem模块向NameNode请求上传文件,NameNode检查目标文件是否已经存在,父目录是否存在; 2.NameNode返回是否可以上传文件; 3.客户端请求一个block上传到指定的那个DataNode服务器上; 4.Nam ...
分类:
其他好文 时间:
2020-03-20 19:52:48
阅读次数:
56
HDFS产生背景 随着数据量越来越大,在一个操作系统存不下所有的数据,那么就分配到更多的操作系统管理的磁盘中中,但是不方便管理和维护,迫切需要一种系统来管理多台机器上的文件,这就是分布式文件管理。HDFS只是分布式文件管理系统中的一种; HDFS是什么 HDFS是基于java的分布式文件系统,允许您 ...
分类:
其他好文 时间:
2020-03-20 13:01:13
阅读次数:
71
a1.sources = s1a1.channels = c1a1.sinks = k1 a1.sources.s1.channels = c1a1.sources.s1.type = spooldira1.sources.s1.spoolDir = /home/abby/dataa1.source ...
分类:
Web程序 时间:
2020-03-20 09:16:44
阅读次数:
81
原文链接: https://www.toutiao.com/i6764296608705151496/ 单词统计的是统计一个文件中单词出现的次数,比如下面的数据源 其中,最终出现的次数结果应该是下面的显示 那么在MapReduce中该如何编写代码并出现最终结果? 首先我们把文件上传到HDFS中(hd ...
分类:
编程语言 时间:
2020-03-20 00:51:35
阅读次数:
96