监控指定文件夹,读取文件(新文件动态读取)里的内容,统计单词的数量。FileSpout.java,监控文件夹,读取新文件内容1234567891011121314151617181920212223242526272829303132333435363738394041424344454647484...
分类:
其他好文 时间:
2015-06-07 23:12:16
阅读次数:
294
1、下载、解压缩2、编辑conf/storm.yaml12345678910111213141516storm.zookeeper.servers:- "vm1"# - "server2"#storm.zookeeper.port: 2181storm.local.dir: "/usr/local/...
分类:
其他好文 时间:
2015-06-07 23:11:37
阅读次数:
180
概念本文列出了Storm的主要概念及相关的信息链接。讨论到的概念有:TopologiesStreamsSpoutsBoltsStreamgroupingsReliabilityTasksWorkersTopologies实时应用的逻辑被打包成了Storm topology。Storm topolog...
分类:
其他好文 时间:
2015-06-07 23:07:40
阅读次数:
220
1、Storm并行度相关的概念Storm集群有很多节点,按照类型分为nimbus(主节点)、supervisor(从节点),在conf/storm.yaml中配置了一个supervisor有多个槽(supervisor.slots.ports),每个槽就是一个JVM,就是一个worker,在每个wo...
分类:
其他好文 时间:
2015-06-07 23:05:40
阅读次数:
301
默认情况下下,一个executor运行一个component,即一个task,但有时会指定多个task:1builder.setBolt("",newXxBolt()).setNumTasks(2);这是为了rebalance命令。
分类:
其他好文 时间:
2015-06-07 23:04:07
阅读次数:
222
本文是对Heron架构做了一下阅读笔记,讲解Heron在现有的Storm架构上做了哪些优化,这些优化能够解决Storm现在的哪些问题。...
分类:
其他好文 时间:
2015-06-05 19:49:10
阅读次数:
204
roleIPhostnamemaster:192.168.1.147cdh1slave1:192.168.1.142cdh2slave2:192.168.1.143cdh3############################################Installstep#########################1.InstallJDK7wget--no-check-certificate--no-cookies--header"Cookie:oraclelicense=accept-..
分类:
其他好文 时间:
2015-06-03 19:53:33
阅读次数:
120
Twitter Heron 论文笔记,简单介绍论文前半部分对storm局限性,从Storm worker、Nimbus以及资源分配这些来阐述目前Storm存在的问题。...
分类:
其他好文 时间:
2015-06-03 19:41:48
阅读次数:
147
小弟不才,工作中也用到了大数据的相关东西,一开始接触的时候,是通过买来的教学视频入的门。这两天整理了一下自己的视频资料,供各位进行下载。
文档截图:...
分类:
其他好文 时间:
2015-06-03 13:42:05
阅读次数:
146
1. 问题 今天为storm程序添加了一个计算bolt,上线后正常,结果发现之前的另一个bolt在将中文插入到hbase中后查询出来乱码。其中字符串是以UTF-8编码的url加密串,然后我使用的URLDecoder.decode(str, "UTF-8")解码,最后插入到hbase中。2. 排查(....
分类:
其他好文 时间:
2015-06-03 13:10:56
阅读次数:
166