将之前自己调研的kafka相关的资料分享给你大家,只是简单研究,作为技术选型的前期准备使用,不设计到很深入使用。...
分类:
其他好文 时间:
2014-11-05 10:55:41
阅读次数:
271
一个更复杂的例子上面的DRPC例子只是为了介绍DRPC概念的一个简单的例子。下面让我们看一个复杂的、确实需要storm的并行计算能力的例子, 这个例子计算twitter上面一个url的reach值。首先介绍一下什么是reach值,要计算一个URL的reach值,我们需要:获取所有微薄里面包含这个UR...
分类:
其他好文 时间:
2014-11-03 22:22:27
阅读次数:
219
Apache Samza is a distributed stream processing framework. It uses Apache
Kafka for messaging, and Apache
Hadoop YARN to provide fault tolerance, processor isolation, security, and resource manage...
分类:
其他好文 时间:
2014-11-02 16:36:31
阅读次数:
255
Storm-源码分析汇总Storm FeaturesStorm 简介Storm Topology的并发度Storm - Guaranteeing message processingStorm - Transactional-topologiesTwitter Storm – DRPCStorm 多...
分类:
其他好文 时间:
2014-11-01 14:37:40
阅读次数:
532
文章源地址:https://github.com/edenhill/librdkafka/blob/master/INTRODUCTION.md
librdkafka 是Apache Kafka 客户端C语言的高性能实现, 能够提供可靠并且表现优秀的客户端,同时它也提供比较初级的C++界面。
Contents
本文主要包含以下章节:
一、性能...
分类:
编程语言 时间:
2014-10-31 11:57:45
阅读次数:
1263
后面为了引入Dubbo RPC框架(用spring配置),先把spring 引入jstorm中,请先了解一下jsorm多线程方面的文档:http://storm.apache.org/documentation/Understanding-the-parallelism-of-a-Storm-topology.html .
A worker process exe...
分类:
编程语言 时间:
2014-10-30 22:43:42
阅读次数:
517
本地模式启动的.
package com.doctor.kafkajstrom;
import java.util.HashMap;
import java.util.Map;
import java.util.concurrent.TimeUnit;
import org.apache.commons.lang.RandomStringUtils;
import org.slf4j.Log...
分类:
编程语言 时间:
2014-10-30 22:37:43
阅读次数:
465
kafka文件系统设计那些事,从架构层面,实现机制角度阐述kafka文件系统高效性能。
一个大文件分成多个小文件段。
多个小文件段,容易定时清除或删除已经消费完文件,减少磁盘占用。
index全部映射到memory直接操作,避免segment file被交换到磁盘增加IO操作次数。
根据索引信息,可以确定发送response到consumer的最大大小。
索引文件元数据存储用的是相对前一个segment file的offset存储,节省空间大小。...
分类:
其他好文 时间:
2014-10-28 20:08:50
阅读次数:
368
1.一台机器断点挂了,重启后再次启动supervisor报错:storm EOFException: null ERROR [Thread-2] storm.event (NO_SOURCE_FILE:invoke(0)) - Error when processing eventjava.lang...
分类:
其他好文 时间:
2014-10-28 13:38:21
阅读次数:
155
最近本人对各种分布式计算平台研究的比较火热,上周的时间简单了了解了Storm的用法,今天马不停蹄的开始了新的学习。同样是非常流行的分布式平台,Spark,跟Hadoop属于同类型的。Spark和Storm一样,作为最近才刚刚开源出来的一个项目,学习的资料相当少,大家都还在学习阶段,所以,我目前的学习的情况也只是限于比较粗糙的学习。
Spark是一个开源的通用并行分布式计...
分类:
其他好文 时间:
2014-10-27 23:10:00
阅读次数:
345