1.HBase是一个分布式的、面向列的开源数据库,该技术来源于 Fay Chang 所撰写的Google论文“Bigtable:一个结构化数据的分布式存储系统”。就像Bigtable利用了Google文件系统(File System)所提供的分布式数据存储一样,HBase在Hadoop之上提供了类似 ...
分类:
其他好文 时间:
2019-05-10 23:31:47
阅读次数:
210
去年11月底,结束了上一份工作,在家待业5个月,很充实。 不记得从哪里看到的理论了,说是:形式好时,努力借势发展;形式不好时,努力提升个人。 我觉得很有道理,就照着做了,积极看书,有些以前看过的,有价值的,又看了第二遍。 整理完读书清单,很有成就感。 这段时间,是我毕业十年,感觉最充实的,心态最积极 ...
分类:
其他好文 时间:
2019-05-06 17:25:50
阅读次数:
146
https://www.cnblogs.com/kevingrace/p/8471827.html 一、分布式文件系统介绍分布式文件系统:Distributed file system, DFS,又叫做网络文件系统:Network File System。一种允许文件通过网络在多台主机上分享的文件系 ...
分类:
系统相关 时间:
2019-05-03 11:18:31
阅读次数:
193
大数据技术的体系庞大且复杂,基础的技术包含数据的采集、数据预处理、分布式存储、NoSQL数据库、数据仓库、机器学习、并行计算、可视化等各种技术范畴和不同的技术层面。首先给出一个通用化的大数据处理框架,主要分为下面几个方面:数据采集与预处理、数据存储、数据清洗、数据查询分析和数据可视化。在这里还是要推荐下我自己建的大数据学习交流群:529867072,群里都是学大数据开发的,如果你正在学习大数据,小
分类:
其他好文 时间:
2019-05-01 11:57:36
阅读次数:
141
1、Storm与Kafka集成 我们知道storm的作用主要是进行流式计算,对于源源不断的均匀数据流流入处理是非常有效的, 而现实生活中大部分场景并不是均匀的数据流,而是时而多时而少的数据流入,这种情况下显然用批量处理是不合适的, 如果使用storm做实时计算的话可能因为数据拥堵而导致服务器挂掉,应 ...
分类:
其他好文 时间:
2019-04-26 11:28:06
阅读次数:
153
大数据技术的体系庞大且复杂,基础的技术包含数据的采集、数据预处理、分布式存储、NoSQL数据库、数据仓库、机器学习、并行计算、可视化等各种技术范畴和不同的技术层面。首先给出一个通用化的大数据处理框架,主要分为下面几个方面:数据采集与预处理、数据存储、数据清洗、数据查询分析和数据可视化。 一、数据采集 ...
分类:
其他好文 时间:
2019-04-23 15:39:37
阅读次数:
163
在 2006 年的 OSDI 上,Google 发布了名为 Bigtable: A Distributed Storage System for Structured Data 的论文,其中描述了一个用于管理结构化数据的分布式存储系统 Bigtable 的数据模型、接口以及实现等 ...
分类:
数据库 时间:
2019-04-17 09:52:54
阅读次数:
185
一:MongoDB简介 MongoDB是一个面向文档的数据库,而不是关系型数据库。具有更好的扩展性,MongoDB从一开始设计的时候就是奔着分布式去的,只需要简单的配置就可以实现高效的分布式存储,被大量的运用于大数据领域。并且MongoDB不再有预定义模式:文档的键(key)和值(value)不再是 ...
分类:
数据库 时间:
2019-04-15 18:12:49
阅读次数:
201
1. hbase简介 1.1. 什么是hbase HBASE是一个高可靠性、高性能、面向列、可伸缩的分布式存储系统,利用HBASE技术可在廉价PC Server上搭建起大规模结构化存储集群。 HBASE的目标是存储并处理大型的数据,更具体来说是仅需使用普通的硬件配置,就能够处理由成千上万的行和列所组 ...
分类:
其他好文 时间:
2019-04-11 16:07:50
阅读次数:
161
1 基本介绍 1.1 前言 HBase – Hadoop Database。是一个分布式的、面向列的开源数据库,该技术来源于 Fay Chang 所撰写的Google论文“Bigtable:一个结构化数据的分布式存储系统”。就像Bigtable利用了Google文件系统(File System)所提 ...
分类:
其他好文 时间:
2019-04-06 23:02:55
阅读次数:
729