码迷,mamicode.com
首页 > Web开发 > 详细

Flume协作框架

时间:2016-11-25 12:19:18      阅读:290      评论:0      收藏:0      [点我收藏+]

标签:spark   park   online   方式   linu   环境   win   架构   reg   

1.概述  

  -》flume的三大功能
    collecting, aggregating, and moving
      收集 聚合 移动

 

2.框图

  技术分享


3.架构特点
  -》on streaming data flows
    基于流式的数据
    数据流:job-》不断获取数据
    任务流:job1->job2->job3&job4


  -》for online analytic application.


  -》Flume仅仅运行在linux环境下
    如果我的日志服务器是Windows?


  -》非常简单
    写一个配置文件,运行这个配置文件
    source、channel、sink


  -》实时架构
    flume+kafka spark/storm impala


  -》agent三大部分
    -》source:采集数据,并发送给channel

    -》channel:管道,用于连接source和sink的
    -》sink:发送数据,用于采集channel中的数据

 

4.Event

  技术分享

 

5.Source/Channel/Sink

  技术分享

二:配置

1.下载解压

  下载的是Flume版本1.5.0

  技术分享

 

2.启用flume-env.sh

  技术分享

 

3.修改flume-env.sh

  技术分享

 

4.增加HADOOP_HOME

  因为在env.sh中没有配置,选择的方式是将hdfs的配置放到conf目录下。

  技术分享

 

5.放入jar包

  技术分享

 

6.验证

  技术分享

 

7.用法

  技术分享

 

8.

  

 

Flume协作框架

标签:spark   park   online   方式   linu   环境   win   架构   reg   

原文地址:http://www.cnblogs.com/juncaoit/p/6100744.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!