码迷,mamicode.com
首页 >  
搜索关键字:kafka    ( 4273个结果
kafka集群搭建与api客户端创建
kafka集群搭建与api客户端创建,以前的消息队列(activeMQ)对于大数据吞吐率不行,但kafka很好的解决了此类问题,并且以集群的方式进行扩展,可谓相当强大...
分类:Windows程序   时间:2015-07-03 17:31:41    阅读次数:444
(一个)kafka-jstorm集群实时日志分析 它 ---------kafka实时日志处理
package com.doctor.logbackextend;import java.util.HashMap;import java.util.List;import java.util.Map;import java.util.Properties;import kafka.consumer...
分类:Web程序   时间:2015-07-01 20:32:42    阅读次数:174
分布式消息系统:Kafka
Kafka 是分布式发布-订阅消息系统。它最初由 LinkedIn 公司开发,之后成为 Apache 项目的一部分。Kafka 是一个分布式的,可划分的,冗余备份的持久性的日志服务。它主要用于处理活跃的流式数据。在大数据系统中,常常会碰到一个问题,整个大数据是由各个子系统组成,数据需要在各个子系统中...
分类:其他好文   时间:2015-06-30 17:47:57    阅读次数:121
大数据组件原理总结-Hadoop、Hbase、Kafka、Zookeeper、Spark
Hadoop原理 分为HDFS与Yarn两个部分。HDFS有Namenode和Datanode两个部分。每个节点占用一个电脑。Datanode定时向Namenode发送心跳包,心跳包中包含Datanode的校验等信息,用来监控Datanode。HDFS将数据分为块,默认为64M每个块信息按照配置的参...
分类:其他好文   时间:2015-06-30 12:29:40    阅读次数:221
kafka教程
一、理论介绍 (一)相关资料 1、官方资料,非常详细:    http://kafka.apache.org/documentation.html#quickstart 2、有一篇翻译版,基本一致,有些细节不同,建议入门时先读此文,再读官方文档。若自认英语很强,请忽视:    http://www.linuxidc.com/Linux/2014-07/104470.htm 3、还有一文...
分类:其他好文   时间:2015-06-27 10:00:56    阅读次数:155
kafka 快速入门
1.3?快速入门 Step 1: 下载Kafka 点击这里下载?Download?并解压 > tar -xzf kafka_2.10-0.8.2.0.tgz> cd kafka_2.10-0.8.2.0 Step 2: 启动服务 Kafka 使用 ZooKeeper 因此需要首先启动 ZooKeeper 服务。如果你...
分类:其他好文   时间:2015-06-24 14:48:32    阅读次数:144
rabbitmq在storm中使用
storm中只能进行任务计算,不能保存中间结果,最后结果。这就有一个需求,保存计算结果,最好还是分布式的,因为storm也是分布式,大数据计算。流行的分布式计算中使用队列保存数据居多。kafka适合大量写入,但是稳定性差,项目采用的是rabbitmq.rabiitmq有2种模式:1.集群模式(高稳定...
分类:其他好文   时间:2015-06-23 19:48:21    阅读次数:213
lagstash + elasticsearch + kibana 3 + kafka 日志管理系统部署 02
因公司数据安全和分析的需要,故调研了一下 GlusterFS + lagstash + elasticsearch + kibana 3 + redis 整合在一起的日志管理应用:安装,配置过程,使用情况等续一,glusterfs分布式文件系统部署: 说明: 公司想做网站业务日志及系统日志统一收集....
分类:其他好文   时间:2015-06-19 23:02:42    阅读次数:356
用fabric部署维护kle日志收集系统
最近搞了一个logstash kafka elasticsearch kibana 整合部署的日志收集系统。部署参考lagstash + elasticsearch + kibana 3 + kafka 日志管理系统部署 02 上线过程中有一些环节,觉得还是值的大家注意的比如:1,应用运维和研发人员...
分类:其他好文   时间:2015-06-19 22:58:06    阅读次数:224
Kafka的分布式架构设计与High Availability机制
最初,Kafka实际上是LinkedIn用于日志处理的分布式消息队列,现今,Kafka主要用于处理活跃的流式数据,如分析用户的行为,对用户搜索关键词进行统计以便分析出当前的流行趋势,存数据库浪费,而直接用传统的存硬盘方式效率又低下的业务数据也可以使用Kafka的分布式进行存储。...
分类:其他好文   时间:2015-06-18 19:57:08    阅读次数:240
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!