码迷,mamicode.com
首页 >  
搜索关键字:spout    ( 174个结果
storm小总结(持续更新)
worker:topology的进程。 executor:线程,由worker产生。 task:具体一个?spout/bolt的实例。 thread和task关系:一个thread可以运行多个实例,但是如果不显示设定task数量:setNumTasks(n),一个thread默认执...
分类:其他好文   时间:2015-09-04 12:57:45    阅读次数:190
Twitter Storm如何保证消息不丢失
storm保证从spout发出的每个tuple都会被完全处理。这篇文章介绍storm是怎么做到这个保证的,以及我们使用者怎么做才能充分利用storm的可靠性特点。一个tuple被”完全处理”是什么意思?就如同蝴蝶效应一样,从spout发射的一个tuple可以引起其它成千上万个tuple因它而产生, ...
分类:其他好文   时间:2015-08-29 16:52:03    阅读次数:107
2015.6.5
1上午学习了JStorm数据流组 spout和bolt都可以并发的执行多个任务,因此必须有一种方法指定哪个数据流路由到哪个spout/bolt,数据流组用来指定一个拓扑内的路由过程。 1)    随机数据流组,是比较常用的一种方式,它指定了一个参数——数据源组件,然后该数据源会向随机选择的bolt发送tuple,当然,JStorm会保证每个bolt接到任务的均衡性。实现方法:shuffleGr...
分类:其他好文   时间:2015-08-27 11:14:41    阅读次数:153
JStorm/Strom配置executors和tasks(线程和实例)
注意:JStorm马上融合到Strom内核了,这意味着以后没有Strom了。 配置executors和tasks(线程和实例) 请始终记得标题:executors和tasks(线程和实例),executors代表线程概念,tasks代表spout或bolt实例。 Storm默认会为每个组成(spout/bolt)创建一个任务(task),默认一个任务运行被一个线程(exe...
分类:编程语言   时间:2015-08-17 01:08:05    阅读次数:144
Jstorm提交任务的流程
今天结合JStorm官方Demo,进一步研磨学习了JStorm提交任务到分配任务的过程,下面是自己的一些认识与理解。 Topology是JStorm对有向无环图的抽象,其内部封装了数据源spout和数据处理对象bolt,以及spout和bolt、bolt和bolt之间的关系。 1) Demo中SequenceTopology对象的SetBuilder(TopologyBuilder b...
分类:Web程序   时间:2015-08-16 16:43:23    阅读次数:237
Storm在批处理和事务方面的机制分析
1、storm事务性topology的提出对于容错机制,Storm通过一个系统级别的组件acker,结合xor校验机制判断一个msg是否发送成功,进而spout可以重发该msg,保证一个msg在出错的情况下至少被重发一次。但是在一些事务性要求比较高的场景中,需要保障一次只有一次的语义,比如需要精确统...
分类:其他好文   时间:2015-08-04 20:45:20    阅读次数:137
storm入门教程 第四章 消息的可靠处理【转】
4.1 简介storm可以确保spout发送出来的每个消息都会被完整的处理。本章将会描述storm体系是如何达到这个目标的,并将会详述开发者应该如何使用storm的这些机制来实现数据的可靠处理。4.2 理解消息被完整处理一个消息(tuple)从spout发送出来,可能会导致成百上千的消息基于此消息被...
分类:其他好文   时间:2015-08-04 00:07:33    阅读次数:139
Stream grouping 并发策略详解
Spout数据源:Messagequeue消息队列 必须使用MQ、Db、文件直接流数据源:MQ从db只能读配置文件Log文件增量数据:1、读出内容写入MQ,2、Storm处理Spout读文件:学习用,其他无用读文件:1、分布式应用无法读;2、spout开并发会重复读Stream grouping策略...
分类:其他好文   时间:2015-08-03 18:40:20    阅读次数:214
Storm的简介
数据来源:HADOOP是HDFS上某个文件夹下的可能是成TB的数据,STORM是实时新增的某一笔数据;Hadoop与Storm的比较处理过程:HADOOP是分MAP阶段到REDUCE阶段,STORM是由用户定义处理流程,流程中可以包含多个步骤,每个步骤可以是数据源(SPOUT)或处理逻辑(BOLT)...
分类:其他好文   时间:2015-07-31 21:51:12    阅读次数:201
storm基础框架分析
背景前期收到的问题: 1、在Topology中我们可以指定spout、bolt的并行度,在提交Topology时Storm如何将spout、bolt自动发布到每个服务器并且控制服务的CPU、磁盘等资源的? 2、Storm处理消息时会根据Topology生成一棵消息树,Storm如何跟踪每个消息、如何保证消息不丢失以及如何实现重发消息机制? 上篇:storm是如何保证at least onc...
分类:其他好文   时间:2015-07-23 00:44:11    阅读次数:113
174条   上一页 1 ... 10 11 12 13 14 ... 18 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!