1、分布式领域CAP理论:Consistency(一致性),
数据一致更新,所有数据变动都是同步的Availability(可用性), 好的响应性能Partition tolerance(分区容错性)
可靠性定理:任何分布式系统只可同时满足二点,没法三者兼顾。忠告:架构师不要将精力浪费在如何设计能满...
分类:
其他好文 时间:
2014-06-10 10:14:30
阅读次数:
232
本文旨在介绍通过两台物理节点,实现完全分布式hadoop程序的安装部署。
分类:
其他好文 时间:
2014-06-10 10:13:49
阅读次数:
313
安装scp mongodb-linux-x86_64-2.6.0.tgz
user@host:/home/user/ssh user@hosttar zxvf mongodb-linux-x86_64-2.6.0.tgzmv
mongodb-linux-x86_64-2.6.0 mongodbcd....
分类:
数据库 时间:
2014-06-09 20:43:24
阅读次数:
226
git 是一种分布式版本控制系统, Distributed Version Control
System.linux 内核开源项目有众多的参与者,2002年, 整个项目组开始启用分布式版本控制系统BitKeeper
来管理和维护代码,到了2005年,开发BitKeeper的公司同Linux内核开源社...
分类:
其他好文 时间:
2014-06-09 20:24:17
阅读次数:
880
Map-reduce是一种优雅的数据处理方式,本文通过三个例子介绍如何用python在linux的管道进行map-reduce编程,本文写的所有map-reduce程序都可以原封不动的放在Hadoop下运行,很容易在大数据集上扩展。
分类:
其他好文 时间:
2014-06-09 19:11:44
阅读次数:
253
Hadoop 的优势Hadoop 是 一 个 能 够 让 用 户 轻 松 架 构 和 使 用 的 分
布 式 计 算 平 台。 用 户 可 以 轻 松 地 在Hadoop 上开发执行处理海量数据的应用程序。它主要有下面几个长处:1.高可靠性。Hadoop
按位存储和处理数据的能力值得人们信赖。2.高...
分类:
其他好文 时间:
2014-06-09 15:48:27
阅读次数:
201
XMLRPC XMLRPC 为以http为传输协议,使用xml格式化数据来执行远程过程调用,
区别于本地过程调用, 即发生在不同主机之间。 属于分布式计算的一种简单实现,比web
service简单易用。xml语言被多种语言广泛支持,是一种可扩展的标记语言,xmlrpc被多种平台实现,以此提供的.....
分类:
其他好文 时间:
2014-06-09 15:34:52
阅读次数:
263
https://github.com/ihrwein/webhdfshttps://tiborbenke.blogs.balabit.com/2013/11/the-syslog-ng-in-the-hadoop-era/https://github.com/prezi/logboxhttp://d...
分类:
Web程序 时间:
2014-06-09 14:54:45
阅读次数:
198
百亿数量级的大数据项目,软硬件总体预算只有30万左右,需求是进行复杂分析查询,性能要求多数分析请求达到秒级响应。
遇到这样的项目需求,预算不多的情况,似乎只能考虑基于Hadoop来实施。
理论上Hadoop撑住百亿数量级没问题,但想要秒级响应各种查询分析就不行了。我们先大概分析一下Hadoop的优缺...
分类:
其他好文 时间:
2014-06-09 14:32:39
阅读次数:
509