Strom的简单实现Spout的实现对文件的改变进行分开的监听,并监视目录下有无新日志文件添加。在数据得到了字段的说明后,将其转换成tuple。声明Spout和Bolt之间的分组,并决定tuple发送给Bolt的途径。Spout中open、nextTuple和delcareOutputFields方...
分类:
其他好文 时间:
2014-07-10 15:01:33
阅读次数:
167
Storm中Spout用于读取并向计算拓扑中发送数据源,最近在调试一个topology时遇到了系统qps低,处理速度达不到要求的问题,经过排查后发现是由于对Spout的使用模式不当导致的多线程同步等待。这里罗列几点个人觉得编写Spout代码时需要特别注意的地方。
分类:
其他好文 时间:
2014-06-29 14:53:27
阅读次数:
306
之前对这个的理解有些问题,今天用到有仔细梳理了一遍,记录一下 首先开启storm tracker机制的前提是, 1. 在spout emit tuple的时候,要加上第3个参数messageid 2. 在配置中acker数目至少为1 3. 在bolt emit的时候,要加上第二个参数anchor t...
分类:
其他好文 时间:
2014-06-25 15:57:09
阅读次数:
251
MRv1
Storm
JobTracker
Nimbus
TaskTracker
Supervisor
Child
Worker
Job
Topology
Map/Reduce
Spout/Blot
shuffle
Stream grouping...
分类:
其他好文 时间:
2014-06-16 21:24:47
阅读次数:
228