搜索关键字：kafka，搜索到4273个结果！码迷,mamicode.com！

kafka集群搭建与api客户端创建，以前的消息队列（activeMQ）对于大数据吞吐率不行，但kafka很好的解决了此类问题，并且以集群的方式进行扩展，可谓相当强大...

分类：Windows程序时间：2015-07-03 17:31:41 阅读次数：444

(一个）kafka-jstorm集群实时日志分析它 ---------kafka实时日志处理

package com.doctor.logbackextend;import java.util.HashMap;import java.util.List;import java.util.Map;import java.util.Properties;import kafka.consumer...

分类：Web程序时间：2015-07-01 20:32:42 阅读次数：174

分布式消息系统：Kafka

Kafka 是分布式发布-订阅消息系统。它最初由 LinkedIn 公司开发，之后成为 Apache 项目的一部分。Kafka 是一个分布式的，可划分的，冗余备份的持久性的日志服务。它主要用于处理活跃的流式数据。在大数据系统中，常常会碰到一个问题，整个大数据是由各个子系统组成，数据需要在各个子系统中...

分类：其他好文时间：2015-06-30 17:47:57 阅读次数：121

大数据组件原理总结-Hadoop、Hbase、Kafka、Zookeeper、Spark

Hadoop原理分为HDFS与Yarn两个部分。HDFS有Namenode和Datanode两个部分。每个节点占用一个电脑。Datanode定时向Namenode发送心跳包，心跳包中包含Datanode的校验等信息，用来监控Datanode。HDFS将数据分为块，默认为64M每个块信息按照配置的参...

分类：其他好文时间：2015-06-30 12:29:40 阅读次数：221

kafka教程

一、理论介绍（一）相关资料 1、官方资料，非常详细： http://kafka.apache.org/documentation.html#quickstart 2、有一篇翻译版，基本一致，有些细节不同，建议入门时先读此文，再读官方文档。若自认英语很强，请忽视： http://www.linuxidc.com/Linux/2014-07/104470.htm 3、还有一文...

分类：其他好文时间：2015-06-27 10:00:56 阅读次数：155

kafka 快速入门

1.3?快速入门 Step 1: 下载Kafka 点击这里下载?Download?并解压 > tar -xzf kafka_2.10-0.8.2.0.tgz> cd kafka_2.10-0.8.2.0 Step 2: 启动服务 Kafka 使用 ZooKeeper 因此需要首先启动 ZooKeeper 服务。如果你...

分类：其他好文时间：2015-06-24 14:48:32 阅读次数：144

rabbitmq在storm中使用

storm中只能进行任务计算，不能保存中间结果，最后结果。这就有一个需求，保存计算结果，最好还是分布式的，因为storm也是分布式，大数据计算。流行的分布式计算中使用队列保存数据居多。kafka适合大量写入，但是稳定性差，项目采用的是rabbitmq.rabiitmq有2种模式：1.集群模式（高稳定...

分类：其他好文时间：2015-06-23 19:48:21 阅读次数：213

lagstash + elasticsearch + kibana 3 + kafka 日志管理系统部署 02

因公司数据安全和分析的需要，故调研了一下 GlusterFS + lagstash + elasticsearch + kibana 3 + redis　整合在一起的日志管理应用：安装，配置过程，使用情况等续一，glusterfs分布式文件系统部署：说明：公司想做网站业务日志及系统日志统一收集....

分类：其他好文时间：2015-06-19 23:02:42 阅读次数：356

用fabric部署维护kle日志收集系统

最近搞了一个logstash kafka elasticsearch kibana 整合部署的日志收集系统。部署参考lagstash + elasticsearch + kibana 3 + kafka 日志管理系统部署 02 上线过程中有一些环节，觉得还是值的大家注意的比如：1，应用运维和研发人员...

分类：其他好文时间：2015-06-19 22:58:06 阅读次数：224

Kafka的分布式架构设计与High Availability机制

最初，Kafka实际上是LinkedIn用于日志处理的分布式消息队列，现今，Kafka主要用于处理活跃的流式数据，如分析用户的行为，对用户搜索关键词进行统计以便分析出当前的流行趋势，存数据库浪费，而直接用传统的存硬盘方式效率又低下的业务数据也可以使用Kafka的分布式进行存储。...

分类：其他好文时间：2015-06-18 19:57:08 阅读次数：240

共4273条上一页 1 ... 394 395 396 397 398 ... 428 下一页

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)