对于kafka的consumer接口,提供两种版本, high-level 一种high-level版本,比较简单不用关心offset, 会自动的读zookeeper中该Consumer group的last offset 参考,https://cwiki.apache.org/confluence...
分类:
其他好文 时间:
2014-06-28 22:39:15
阅读次数:
1224
参考, https://cwiki.apache.org/confluence/display/KAFKA/System+Tools https://cwiki.apache.org/confluence/display/KAFKA/Replication+tools http://kafka.ap...
分类:
其他好文 时间:
2014-06-28 22:01:55
阅读次数:
637
一:flume介绍 Flume是一个分布式、可靠、和高可用的海量日志聚合的系统,支持在系统中定制各类数据发送方,用于收集数据;同时,Flume提供对数据进行简单处理,并写到各种数据接受方(可定制)的能力。,Flume架构分为三个部分 源-Source,接收器-Sink,通道-Channel。二:配置...
分类:
其他好文 时间:
2014-06-21 08:59:50
阅读次数:
245
要在一个Flume Agent中定义数据流,你需要通过一个Channel将Source和Sink连接起来。你需要列出给定Agent的Source、Sink和Channel。一个Source可以指定多个Channel,但是一个Sink只能指定一个Channel。...
分类:
其他好文 时间:
2014-06-18 06:30:34
阅读次数:
306
简介Apache Kafka是分布式发布-订阅消息系统。它最初由LinkedIn公司开发,之后成为Apache项目的一部分。Kafka是一种快速、可扩展的、设计内在就是分布式的,分区的和可复制的提交日志服务。Apache Kafka与传统消息系统相比,有以下不同:它被设计为一个分布式系统,易于向外扩...
分类:
其他好文 时间:
2014-06-17 20:04:58
阅读次数:
201
rsyslog服务端配置centos6.4x64系统系统自带rsyslog5.8版本rsyslog是一个syslogd的多线程增强版。现在Fedora和Ubuntu,rhel6默认的日志系统都是rsyslog了rsyslog负责写入日志,logrotate负责备份和删除旧日志,以及更新日志文件####################################首先部署好lam..
分类:
其他好文 时间:
2014-06-17 16:56:50
阅读次数:
365
主要介绍Hadoop家族产品,常用的项目包括Hadoop, Hive, Pig, HBase, Sqoop, Mahout, Zookeeper, Avro, Ambari, Chukwa,新增加的项目包括,YARN, Hcatalog, Oozie, Cassandra, Hama, Whirr, Flume, Bigtop, Crunch, Hue等。
从2011年开始,中国进入大数据风起云...
分类:
其他好文 时间:
2014-06-17 16:44:25
阅读次数:
310
======博主所学知识来着于恩师马哥的亲授======
马哥教育“2014夏令营”开始啦!!!马哥教育是目前性价比最高的Linux培训,国内好评度排名第一,并被网友称为Linux界的"黄埔军校",全部课程采用Centos6.5x86_64讲解,经过几期网络班的总结和锤炼,逐渐完善的课程体系,学员学习进度监督和优质的考试系统检验学员掌握程度,活跃的在线答疑环节,名师陪伴,牛人指点,精彩不容错过。...
分类:
其他好文 时间:
2014-06-15 08:19:37
阅读次数:
409
首先要知道两台主机之间同步文件udp虽然安全性不高,但是它的同步速率远远高于tcp。这点是不可否认的。我们以简单的为例:服务端:允许别的主机可以把日志同步到自己的主机上来。#
vim /etc/rsyslog.conf$ModLoad imudp//开启udp协议,添加udp模块。$UDPServe...
分类:
其他好文 时间:
2014-06-12 07:09:21
阅读次数:
240