码迷,mamicode.com
首页 >  
搜索关键字:spout    ( 174个结果
storm Ack框架笔记
Storm利用Acker Bolt节点跟踪消息,当Spout发送出去的消息以及这些消息所衍生出来的消息均被处理后,Spout将受到对应于该消息的Ack。实现要点: 1、Storm中每条发送出去的消息都会对应一个随机的消息ID。 2、Spout发送消息后,将向Acker Bolt发送一条消息,该消息内 ...
分类:其他好文   时间:2016-06-05 21:23:29    阅读次数:235
storm wordcount实例
在storm环境部署完毕,并正确启动之后,现在就可以真正进入storm开发了,按照惯例,以wordcount作为开始。这个例子很简单,核心组件包括:一个spout,两个bolt,一个Topology。spout从一个路径读取文件,然后readLine,向bolt发射,一个文件处理完毕后,重命名,以不 ...
分类:其他好文   时间:2016-06-02 22:03:20    阅读次数:625
backtype.storm.generated.InvalidTopologyException:null问题的解决
程序启动报错:backtype.storm.generated.InvalidTopologyException:null 问题解决方法: 这个错误一般都是没有定义输出列造成的 检查Spout和Bolt代码中的declareOutputFields方法declare的Field数量 等于 colle ...
分类:其他好文   时间:2016-06-02 19:51:03    阅读次数:2275
课堂笔记--Strom并发模型
Strom并发模型: topology是如何运行的?(可与mapreduce对比) 第一层:cluster 第二层:supervisor(host、node、机器) 第三层:worker(进程) 第四层:executor(线程) 第五层:task(线程的一个个对象、如Spout和Blot)//top... ...
分类:其他好文   时间:2016-05-18 23:44:39    阅读次数:232
Storm的自适应动态流控制算法
前言     业务的日志ETL拉取框架一直存在很多问题,每次出现故障就导致手忙大乱,因此这次决心要对其进行大改造。这个ETL系统是基于Storm实现的,主要是依靠Spout拉取原始日志,Bolt进行处理再入库,为了提高吞吐量,采用了12个Bolt进行并行处理。旧算法由于没有使用Storm的ack特性,而且还是根据发送Tuple的hash值发送到对应的Bolt中,完全没有考虑好负载均衡问题...
分类:编程语言   时间:2016-05-13 03:16:34    阅读次数:1184
Storm 基础 -- spout与bolt设置多重grouping
Topology的代码如下:TopologyBuilder builder = new TopologyBuilder(); //WordReaderSpout会从文件中读取数据,数据用shuffle的方式发送给bolt进行处理 //当文件读取完成后,会发送一个global消息 builder.setSpout("word-reader",new WordReaderSpout()); builde...
分类:其他好文   时间:2016-05-12 21:33:54    阅读次数:2430
storm流处理的简单例子的一些问题
最近,在“gettingstartedwithstorm”这本书上看到了一个比较简单的storm处理的例子,但是出了比较奇怪的问题,下面代码和输出日志。首先是spout类。 packagespouts; importjava.io.BufferedReader; importjava.io.FileNotFoundException; importjava.io.FileReader; importja..
分类:其他好文   时间:2016-05-09 18:55:01    阅读次数:339
Worker的内部工作原理
storm集群中的一台机器可能运行着一个或者多个worker进程,其从属于一个或者多个topology。一个worker进程运行着多个executor线程;每一个worker从属于一个topology;executor是单线程,每一个executor运行着相同组件(spout或者bolt)的1个或者
分类:其他好文   时间:2016-03-18 17:51:15    阅读次数:194
storm的并发机制
storm的并发机制 storm计算支持在多台机器上水平扩容,通过将计算切分为多个独立的tasks在集群上并发执行来实现。 一个task可以简单地理解:在集群某节点上运行的一个spout或者bolt实例。 topology的组成部分:Nodes(服务器):配置在一个storm集群中的服务器,会执行t
分类:其他好文   时间:2016-03-09 20:41:04    阅读次数:164
storm源代码分析---Transactional spouts
Transactionalspouts Trident是以小批量(batch)的形式在处理tuple。而且每一批都会分配一个唯一的transaction id。不同spout的特性不同,一个transactionalspout会有例如以下这些特性: 1、有着相同txid的batch一定是一样的。当重
分类:其他好文   时间:2016-03-04 13:10:06    阅读次数:213
174条   上一页 1 ... 7 8 9 10 11 ... 18 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!