GentleRain: Cheap and Scalable Causal Consistency with Physical Clocks这是一篇偏理论的文章,分布式系统中时钟是件大事。我看到一作前些年做virtual machine performance profiling,到这一篇一下子做起...
分类:
其他好文 时间:
2015-05-29 06:06:30
阅读次数:
170
集群介绍什么是集群集群是一种并行或分布式系统,该系统包括一个互连的整体计算机集合作为一种单一,统一的计算机资源使用。集群,是指一组互相独立的计算机,利用高速通信网络组成的一个计算机系统,其中的每个节点都是运行自己进程的独立服务器。这些进程可以彼此通信,对网..
分类:
其他好文 时间:
2015-05-28 14:16:29
阅读次数:
215
摘要 Kafka在0.8以前的版本中,并不提供High Availablity机制,一旦一个或多个Broker宕机,则宕机期间其上所有Partition都无法继续提供服务。若该Broker永远不能再恢复,亦或磁盘故障,则其上数据将丢失。而Kafka的设计目标之一即是提供数据持久化,同时对于分布式系....
分类:
其他好文 时间:
2015-05-27 15:23:04
阅读次数:
132
ZooKeeper是Hadoop Ecosystem中非常重要的组件,它的主要功能是为分布式系统提供一致性协调(Coordination)服务,与之对应的Google的类似服务叫Chubby。今天这篇文章分为三个部分来介绍ZooKeeper,第一部分介绍ZooKeeper的基本原理,第二部分介绍Zo...
分类:
其他好文 时间:
2015-05-26 22:57:18
阅读次数:
163
LinuxCluster类型分类:负载均衡集群:Loadbalancing高可用集群:HighAvaiability高性能集群:HighPerformance及分布式系统LB:LB的实现是在提供相同服务的多台服务器之前添加调度器即负载均衡集群工作协议层来划分;tcp:根据请求报文中的目标地址和端口进行调度;应用层:根据..
分类:
系统相关 时间:
2015-05-25 06:17:23
阅读次数:
479
1.软件下载:wgethttp://apache.dataguru.cn/hadoop/common/hadoop-2.7.0/hadoop-2.7.0.tar.gzwgethttp://download.oracle.com/otn-pub/java/jdk/7u79-b15/jdk-7u79-linux-x64.tar.gz2.配置安装java:tar-zxvfjdk-7u79-linux-x64.tar.gz-C/usr/localcd/usr/localchown-Rroot./usr..
分类:
其他好文 时间:
2015-05-25 06:14:26
阅读次数:
179
1、一致性哈希。在分布式系统用途广泛。2、局部敏感哈希LSH:simhash和minhash。可以用于相似度检测等。谷歌有篇文章利用LSH进行网页去重。3、布隆过滤器。判断一个元素是否在一个集合中。4、在数据流算法中哈希算法应用更是广泛。比如数据流中独立元素计数等。5、特征哈希。近几年在nips等机...
分类:
其他好文 时间:
2015-05-24 15:34:48
阅读次数:
111
Hadoop是一个由Apache基金会所开发的分布式系统基础架构。用户可以在不了解分布式底层细节的情况下,开发分布式程序。充分利用集群的威力进行高速运算和存储。Hadoop实现了一个分布式文件系统(Hadoop Distributed File System),简称HDFS。HDFS有高容错性的特点...
分类:
其他好文 时间:
2015-05-22 16:36:03
阅读次数:
107
又一个多月没冒泡了,其实最近学了些东西,但是没有安排时间整理成博文,后续再奉上。最近还写了一个发邮件的组件以及性能测试请看?《NET开发邮件发送功能的全面教程(含邮件组件源码)》?,还弄了个MSSQL参数化语...
分类:
其他好文 时间:
2015-05-22 13:39:38
阅读次数:
242
任何分布式系统都要面对的事儿就包括扩容,不然分布式系统存在的意义就大打折扣了,这篇就介绍一下对GP进行扩容的准备过程,事实上,扩容的实施是个非常简单的过程,主要要做的就是准备。...
分类:
数据库 时间:
2015-05-21 14:14:02
阅读次数:
279