Storm里面引入DRPC主要是利用storm的实时计算能力来并行化CPU密集型(CPU intensive)的计算任务。DRPC的stormtopology以函数的参数流作为输入,而把这些函数调用的返回值作为topology的输出流。DRPC其实不能算是storm本身的一个特性, 它是通过组合st...
分类:
其他好文 时间:
2015-05-27 19:02:12
阅读次数:
114
数据模型(DataModel)storm使用tuple来作为它的数据模型。每个tuple是一堆值,每个值有一个名字,并且每个值可以是任何类型,在我的理解里面一个tuple可以看作一个没有方法的java对象。总体来看,storm支持所有的基本类型,字符串以及字节数组作为tuple的值类型。你也可以使用你..
分类:
其他好文 时间:
2015-05-26 19:05:57
阅读次数:
103
数据模型(Data Model)
storm使用tuple来作为它的数据模型。每个tuple是一堆值,每个值有一个名字,并且每个值可以是任何类型, 在我的理解里面一个tuple可以看作一个没有方法的java对象。总体来看,storm支持所有的基本类型,字符串以及字节数组作为tuple的值类 型。你也可以使用你自己定义的类型来作为值类型,
只要你实现对应的序列化器(serializer)。 ...
分类:
其他好文 时间:
2015-05-26 18:54:46
阅读次数:
98
数据模型(Data Model)storm使用tuple来作为它的数据模型。每个tuple是一堆值,每个值有一个名字,并且每个值可以是任何类型, 在我的理解里面一个tuple可以看作一个没有方法的java对象。总体来看,storm支持所有的基本类型,字符串以及字节数组作为tuple的值类 型。你也可...
分类:
其他好文 时间:
2015-05-26 18:34:36
阅读次数:
114
流分组在设计一个topology的时候,你需要做的最重要的事情是定义数据在组件之间怎样交换(流怎样被bolts消费)。流分组指定了每个bolt消费哪些流和这些流被怎样消费。一个结点可以发射不止一条数据流。流分组允许我们选择接收哪些流。正如我们在第二章看到的,当topology被定义的..
分类:
其他好文 时间:
2015-05-25 20:36:05
阅读次数:
135
流分组
在设计一个topology的时候,你需要做的最重要的事情是定义数据在组件之间怎样交换(流怎样被bolts消费)。流分组指定了每个bolt消费哪些流和这些流被怎样消费。
一个结点可以发射不止一条数据流。流分组允许我们选择接收哪些流。
正如我们在第二章看到的,当topology被定义的时候流分组就被设置好了:
...
builder.setBolt("word-normal...
分类:
其他好文 时间:
2015-05-25 18:46:40
阅读次数:
151
流分组在设计一个topology的时候,你需要做的最重要的事情是定义数据在组件之间怎样交换(流怎样被bolts消费)。流分组指定了每个bolt消费哪些流和这些流被怎样消费。一个结点可以发射不止一条数据流。流分组允许我们选择接收哪些流。正如我们在第二章看到的,当topology被定义的时候流分组就被设...
分类:
其他好文 时间:
2015-05-25 18:35:17
阅读次数:
121
基础http://os.51cto.com/art/201308/408739.htm模型http://www.cnblogs.com/linjiqin/archive/2013/05/28/3104016.html一、Storm基本概念在运行一个Storm任务之前,需要了解一些概念:Topolog...
分类:
其他好文 时间:
2015-05-25 18:20:10
阅读次数:
374
Storm几个重要的优化isusse,含有升级讨论的详细细节,供开发者和使用者参考。...
分类:
其他好文 时间:
2015-05-25 16:37:21
阅读次数:
114
美团的日志收集系统负责美团的所有业务日志的收集,并分别给Hadoop平台提供离线数据和Storm平台提供实时数据流。美团的日志收集系统基于Flume设计和搭建而成。《基于Flume的美团日志收集系统》将分两部分给读者呈现美团日志收集系统的架构设计和实战经验。第一部分架构和设计,将主要着眼于日志收集系...
分类:
Web程序 时间:
2015-05-25 16:33:38
阅读次数:
173