Linux系统启动流程 从上至下为: BIOS MBR:Boot Code 执行引导程序-GRUB(操作系统) 加载内核 执行init run level 1.BIOS(Basic Input Output System) 基本输入输出系统,一般保存在主板上的BIOS的芯片中,负责检查硬件/查找可启 ...
分类:
系统相关 时间:
2019-08-28 11:06:45
阅读次数:
92
HDFS:Hadoop Distributed File System ,Hadoop分布式文件系统,主要用来解决海量数据的存储问题。分NameNode、SecondaryNameNode、DataNode这几个角色。 ...
分类:
其他好文 时间:
2019-08-28 09:14:04
阅读次数:
87
好程序员大数据学习路线Hadoop学习干货分享,ApacheHadoop为可靠的,可扩展的分布式计算开发开源软件。ApacheHadoop软件库是一个框架,它允许使用简单的编程模型跨计算机群集分布式处理大型数据集(海量的数据)。包括这些模块:HadoopCommon:支持其他Hadoop模块的常用工具。Hadoop分布式文件系统(HDFS?):一种分布式文件系统,可提供对应用程序数据的高吞吐量
分类:
其他好文 时间:
2019-08-27 17:06:02
阅读次数:
85
Hadoop 是什么 Hadoop 是一个开源的大数据框架同时也是一个分布式计算的解决方案。Hadoop = HDFS (分布式文件系统)+MapReduce(分布式计算) HDFS HDFS 概念 数据块 NameNode DataNode 数据块: 数据块是一个抽象的块,而不是整个文件。默认大小 ...
分类:
其他好文 时间:
2019-08-25 12:00:12
阅读次数:
120
一.分布式文件系统: 是指文件系统管理的物理存储资源不一定直接是连接在本地节点上,而是通过计算机网络与节点相连. 分布式文件系统的设计基与C/S架构(客户端/服务器) 常见的分布式文件系统:Ceph、(红帽)Hadoop、FastDFS(国产) 二.Ceph分布式文件系统 特点:具有高扩展、高可用、 ...
分类:
其他好文 时间:
2019-08-24 22:50:33
阅读次数:
111
启动mysql: mysql.server start 停止服务:mysql.server stop ...
分类:
数据库 时间:
2019-08-24 10:06:12
阅读次数:
147
GlusterFS简介: 互联网四大开源分布式文件系统分别是:MooseFS、CEPH、Lustre、GusterFS. GluterFS最早由Gluster公司开发,其目的是开发一个能为客户提供全局命名空间、分布式前端及高达数百PB级别扩展性的分布式文件系统。 相比其他分布式文件系统,Gluste ...
分类:
其他好文 时间:
2019-08-23 00:01:14
阅读次数:
280
第七章 推荐系统实例 7.1 外围架构 数据收集和存储 需要实时存取的数据存储在数据库和缓存中,而大规模的非实时地存取数据存储在分布式文件系统中(HDFS)中。 7.2 推荐系统架构 用户和物品的联系如下所示: 如果认为用户喜欢的物品也是一种用 户特征,或者和用户兴趣相似的其他用户也是一种用户特征, ...
分类:
其他好文 时间:
2019-08-22 13:23:02
阅读次数:
115
JavaScript 的类型分为两种:原始数据类型(Primitive data types)和对象类型(Object types)。 原始数据类型包括:布尔值、数值、字符串、null、undefined 以及 ES6 中的新类型 Symbol。 本节主要介绍前五种原始数据类型在 TypeScrip ...
分类:
其他好文 时间:
2019-08-21 00:21:02
阅读次数:
103
为什么要有Hadoop? 从计算机诞生到现今,积累了海量的数据,这些海量的数据有结构化、半结构化、非 结构的数据,并且这些海量的数据存储和检索就成为了一大问题。 我们都知道大数据技术难题在于一个数据复杂性、数据量、大规模的数据计算。 Hadoop就是为了解决这些问题而出现的。 Hadoop的诞生 D ...
分类:
其他好文 时间:
2019-08-20 01:15:59
阅读次数:
113