下载地址: "网盘下载" 《高可用性的HDFS:Hadoop分布式文件系统深度实践》专注于Hadoop分布式文件系统(HDFS)的主流HA解决方案,内容包括:HDFS元数据解析、Hadoop元数据备份方案、Hadoop Backup Node方案、AvatarNode解决方案以及最新的HA解决方案C ...
分类:
其他好文 时间:
2018-07-14 18:25:14
阅读次数:
146
Hadoop是一个利用大规模计算机集群,可处理大量数据的分布式并行框架。 "Hadoop 官网" Hadoop的核心设计包括HDFS和MapReduce。 HDFS HDFS(Hadoop Distributed File System)是一种分布式文件系统。 主要特点:1.高容错性;2.高吞吐量访 ...
分类:
其他好文 时间:
2018-07-13 23:20:10
阅读次数:
194
Hadoop是一个利用大规模计算机集群,可处理大量数据的分布式并行框架。 "Hadoop 官网" Hadoop的核心设计包括HDFS和MapReduce。 HDFS HDFS(Hadoop Distributed File System)是一种分布式文件系统。 主要特点:1.高容错性;2.高吞吐量访 ...
分类:
其他好文 时间:
2018-07-13 23:18:54
阅读次数:
193
Ceph基本情况的介绍 Ceph是一个分布式存储软件。 它支持用3种方式存储数据,分别是:对象存储、块设备存储、分布式文件系统存储。 Ceph最初的目标是做一个分布式文件系统,直到现在这个目标也不能算完美实现,目前官网上对它的文件系统还是谨慎推荐的态度(不建议对线上核心业务部署),业界使用 Ceph ...
分类:
其他好文 时间:
2018-07-11 17:56:19
阅读次数:
152
Hadoop简介 Hadoop是Apache软件基金会旗下的一个开源分布式计算平台,为用户提供了系统底层细节透明的分布式基础架构。 Hadoop是基于Java语言开发的,具有很好的跨平台特性,并且可以部署在廉价的计算机集群中。 Hadoop的核心是分布式文件系统(Hadoop Distributed ...
分类:
其他好文 时间:
2018-07-11 15:10:35
阅读次数:
311
博客内容来自我啃的Hadoop权威指南,记录一下帮助自己理一下思路 一、文件读取 步骤1,客户端通过调用 FileSystem 对象的 open() 方法来打开想读取的文件,对于 HDFS 来说,这个对象是分布式文件系统(DistributedFileSystem)的一个实例 步骤2,Distrib ...
分类:
其他好文 时间:
2018-07-08 21:16:38
阅读次数:
246
GlusterFS(GNU ClusterFile System)是一个开源的分布式文件系统,它的历史可以追溯到2006年,最初的目标是代替Lustre和GPFS分布式文件系统。经过八年左右的蓬勃发展,GlusterFS目前在开源社区活跃度非常之高,这个后起之秀已经俨然与Lustre、MooseFS ...
分类:
其他好文 时间:
2018-07-05 23:37:02
阅读次数:
181
FastDFS 是国内电商网站非常出名的一套框架,在国内的电商网站使用概率是非常大的,是淘宝的前架构师用 c 语言编写的一款开源的分布式文件系统。充分考虑了冗余备份(纵向)、负载均衡、线性扩容(横向)等机制,并注重高可用、高性能等指标,使用 FastDFS 很容易搭建一套高性能的文件服务器集群提供文 ...
分类:
其他好文 时间:
2018-07-03 23:57:32
阅读次数:
1433
简介:ApacheSqoop是专为ApacheHadoop和结构化数据存储如关系数据库之间的数据转换工具的有效工具。你可以使用Sqoop从外部结构化数据存储的数据导入到Hadoop分布式文件系统或相关系统如Hive和HBase。相反,Sqoop可以用来从Hadoop的数据提取和导出到外部结构化数据存储如关系数据库和企业数据仓库。Sqoop专为大数据批量传输设计,能够分割数据集并创建Hadoop任务
分类:
其他好文 时间:
2018-07-03 18:17:46
阅读次数:
168
个人博客地址:https://kekbin.com/ 概述 IPFS的全称是InterPlanetary File System(星际文件系统),从名称上看,这是一个很炫酷、很有野心的项目。简单地说它就是一个点对点的分布式文件系统。 "官网" 和 "github" 都可以找到所有的相关资料。建议从它 ...
分类:
其他好文 时间:
2018-07-02 13:08:30
阅读次数:
158