kafka文件系统设计那些事,从架构层面,实现机制角度阐述kafka文件系统高效性能。
一个大文件分成多个小文件段。
多个小文件段,容易定时清除或删除已经消费完文件,减少磁盘占用。
index全部映射到memory直接操作,避免segment file被交换到磁盘增加IO操作次数。
根据索引信息,可以确定发送response到consumer的最大大小。
索引文件元数据存储用的是相对前一个segment file的offset存储,节省空间大小。...
分类:
其他好文 时间:
2014-10-28 20:08:50
阅读次数:
368
这三样东西分别作用是:日志收集、索引与搜索、可视化展现l logstash 这张架构图可以看出logstash只是collect和index的地方,运行时传入一个.conf文件,配置分三部分:input ,filter,output。l redis redis在这里是作为日志收集与索引之间解耦...
分类:
其他好文 时间:
2014-10-28 17:19:54
阅读次数:
812
package com.doctor.logbackextend;
import java.util.HashMap;
import java.util.List;
import java.util.Map;
import java.util.Properties;
import kafka.consumer.Consumer;
import kafka.consumer.ConsumerCo...
分类:
Web程序 时间:
2014-10-26 09:07:44
阅读次数:
383
流程:1.X端发送数据到kafka(如web端发送的订单数据)。2.storm从kafka获取数据进行分析。 a.storm与kafka整合,获得数据——Sport b.storm对数据进行分析——Bolt 3.结果保存和显示(或者传给别人)。 a.将结果保存到DB(Hbase,redi...
分类:
其他好文 时间:
2014-10-25 17:13:49
阅读次数:
220
kafka自己居然没有还一个Web管理界面。。
这里有个第三方的:
https://github.com/claudemamo/kafka-web-console
坑爹的是居然没有详细的安装步骤,只有一些简单的说明,对于不熟悉scala play开发的人来说,很蛋疼。下面记录详细的安装过程。
先下载安装scala的构建工具sbt,最新版本可以到官网查看:
http://ww...
分类:
Web程序 时间:
2014-10-24 20:53:54
阅读次数:
253
Kafka 分布式消息队列 类似产品有JBoss、MQ一、由Linkedln 开源,使用scala开发,有如下几个特点:(1)高吞吐(2)分布式(3)支持多语言客户端 (C++、Java)二、组成: 客户端是 producer 和 consumer,提供一些API,服务器端是Broker,客户端提供...
分类:
其他好文 时间:
2014-10-23 16:13:44
阅读次数:
199
今天重启了下Hadoop集群,使用Eclipse调试hdfs api的时候报错:[WARNING] java.lang.NullPointerException at org.conan.kafka.HdfsUtil.batchWrite(HdfsUtil.java:50) at org...
分类:
其他好文 时间:
2014-10-23 12:20:22
阅读次数:
254
flume是一个实时消息收集系统,它定义了多种的source、channel、sink,可以根据实际情况选择。Flume下载及文档:http://flume.apache.org/Kafkakafka是一种高吞吐量的分布式发布订阅消息系统,她有如下特性:通过O(1)的磁盘数据结构提供消息的持久化,这种结构对于即使数以TB的..
分类:
Web程序 时间:
2014-10-22 18:36:34
阅读次数:
338
Logstash+ElasticSearch+Kibana3架构日志系统一,分析系统简介日志监控和分析在保障业务稳定运行时,起到了很重要的作用,不过一般情况下日志都分散在各个生产服务器,且开发人员无法登陆生产服务器,这时候就需要一个集中式的日志收集装置,对日志中的关键字进行监控,触发异..
分类:
其他好文 时间:
2014-10-20 15:21:50
阅读次数:
388
kafka是一种高吞吐量的分布式发布订阅消息系统,她有如下特性:
通过O(1)的磁盘数据结构提供消息的持久化,这种结构对于即使数以TB的消息存储也能够保持长时间的稳定性能。
高吞吐量:即使是非常普通的硬件kafka也可以支持每秒数十万的消息。
支持通过kafka服务器和消费机集群来分区消息。
支持H...
分类:
其他好文 时间:
2014-10-13 18:48:06
阅读次数:
165