目录: 一、什么是Flume? 1)flume的特点 2)flume的可靠性 3)flume的可恢复性 4)flume 的 一些核心概念 二、flume的官方网站在哪里? 三、在哪里下载? 四、如何安装? 五、flume的案例 1)案例1:Avro 2)...
分类:
其他好文 时间:
2014-08-10 21:12:21
阅读次数:
495
收集:各种开源的分布式日志收集系统:Scribe, Flume等等存储可以同时包含各种不同的存储类型,可根据不同的需求增减相应的存储类型:底层存储:能够存储大量的数据,最好具有可扩展性 HDFS S3等等关系存储:MySQL,Postgresql等等键值存储:HBase,Redis等等计算计算能力也...
分类:
其他好文 时间:
2014-07-30 09:48:23
阅读次数:
213
Exception in thread "SinkRunner-PollingRunner-DefaultSinkProcessor" java.lang.OutOfMemoryError 最近总是被这个错误爆,终于找到了解决方法。 maxOpenFile 默认 5000 , 调到500后错误不在出现。 详见下面j...
分类:
其他好文 时间:
2014-07-30 01:09:53
阅读次数:
247
本日志由系统自动生成。
从7月14日起便按照心想事成的节奏进入了实验室。打酱油。周末又去学活值班,生活的框架还是很不错的。
1、基于Hadoop的Flume,zooKeeper,这些东西算是明白了个大概。
2、第一周大概学习了javascript、jquery、css、ci框架(php)这些基本的东...
分类:
其他好文 时间:
2014-07-30 00:41:42
阅读次数:
279
1、下载 http://www.apache.org/dist/flume/stable/下载最新的tar.gz包即可2、解压tar -zxvf ....3、配置环境变量FLUME_HOME和PATH记得执行source /etc/profile4、添加一个简单的测试案例a、在conf目录下新建一个...
分类:
其他好文 时间:
2014-07-28 15:07:43
阅读次数:
170
Flume简介
Flume是Cloudera提供的一个高可用的,高可靠的,分布式的海量日志采集、聚合和传输的系统,Flume支持在日志系统中定制各类数据发送方,用于收集数据;同时,Flume提供对数据进行简单处理,并写到各种数据接受方(可定制)的能力。
系统功能
日志收集
Flume最早是Cloud...
分类:
其他好文 时间:
2014-07-28 14:41:13
阅读次数:
491
Flume的内置监控怎么整?这个问题有很多人问。目前了解到的信息是可以使用Cloudera Manager、Ganglia有图形的监控工具,以及从浏览器获取json串,或者自定义向其他监控系统汇报信息。那监控的信息是什么呢?就是各个组件的统计信息,比如成功接收的Event数量、成功发送的Even.....
分类:
其他好文 时间:
2014-07-16 17:54:32
阅读次数:
253
1.flume的基本概念
本文中所有与flume相关术语都采用斜体英文表示,这些术语的含义如下所示。
flume 一个可靠的,分布式的,用于采集,聚合,传输海量日志数据的系统。
Web Server 一个产生 Events 的系统。
Agent flume 系统中的一个节点,它主要包含三个部件:Source, Channel...
分类:
其他好文 时间:
2014-07-15 12:59:26
阅读次数:
402