码迷,mamicode.com
首页 >  
搜索关键字:agents flume    ( 1276个结果
Flume Source 实例
Avro Source 监听avro端口,接收外部avro客户端数据流。跟前面的agent的Avro Sink可以组成多层拓扑结构。 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 a1.sources=s1 a1.sinks=k1 a1.channels=c1 a1. ...
分类:Web程序   时间:2017-01-13 23:33:38    阅读次数:368
flume拦截器
拦截器作用:拦截器是简单的插件式组件,设置在source和channel之间。source接收到的事件,在写入channel之前,拦截器都可以进行转换或者删除这些事件。每个拦截器只处理同一个source接收到的事件。可以自定义拦截器。 flume修改时间戳的插件见 https://github.co ...
分类:Web程序   时间:2017-01-13 22:01:04    阅读次数:174
Flume 入门--几种不同的Sources
1.flume概念 flume是分布式的,可靠的,高可用的,用于对不同来源的大量的日志数据进行有效收集、聚集和移动,并以集中式的数据存储的系统。 flume目前是apache的一个顶级项目。 flume需要java运行环境,要求java1.6以上,推荐java1.7. 将下载好的flume安装包解压 ...
分类:Web程序   时间:2017-01-09 23:54:27    阅读次数:3575
Hadoop 2.x 生态系统及技术架构图
一、负责收集数据的工具:Sqoop(关系型数据导入Hadoop)Flume(日志数据导入Hadoop,支持数据源广泛)Kafka(支持数据源有限,但吞吐大) 二、负责存储数据的工具:HBaseMongoDBCassandraAccumulo MySqlOracleDB2 HDFS(Hadoop Di ...
分类:其他好文   时间:2017-01-06 00:07:46    阅读次数:343
apache-flume重启脚本
apache-flume重启脚本,apache-flume重启经常性的启动多个进程,杀不干净,就写个重启脚本。#echo-e参数输出为红色,网上可以搜下shell输出带颜色的字体编码很多。catobi-track_restart.sh #!/bin/bash pid=`lsof-i:8787|grepjava|awk‘{print$2}‘` if[-n"${pid}"];then echo-e"#..
分类:Web程序   时间:2017-01-03 17:29:22    阅读次数:384
flume原理及代码实现
转载标明出处:http://www.cnblogs.com/adealjason/p/6240122.html 最近想玩一下流计算,先看了flume的实现原理及源码 源码可以去apache 官网下载 下面整理下flume的原理及代码实现: flume是一个实时数据收集工具,hadoop的生态圈之一, ...
分类:Web程序   时间:2016-12-31 20:46:48    阅读次数:582
实时事件统计项目:优化flume:用file channel代替mem channel
背景:利用kafka+flume+morphline+solr做实时统计。 solr从12月23号开始一直没有数据。查看日志发现,因为有一个同事加了一条格式错误的埋点数据,导致大量error。 据推断,是因为使用mem channel占满,消息来不及处理,导致新来的数据都丢失了。 修改flume使用 ...
分类:Web程序   时间:2016-12-28 19:40:54    阅读次数:207
Spark机器学习· 实时机器学习
Spark机器学习 1 在线学习 模型随着接收的新消息,不断更新自己;而不是像离线训练一次次重新训练。 2 Spark Streaming 离散化流(DStream) 输入源:Akka actors、消息队列、Flume、Kafka、…… http://spark.apache.org/docs/l ...
分类:其他好文   时间:2016-12-27 14:23:03    阅读次数:245
那些年踏过的Apache Flume之路
Flume作为日志采集系统,有着独特的应用和优势,那么Flume在实际的应用和实践中到底是怎样的呢?让我们一起踏上Flume之路。1、什么是ApacheFlume(1)ApacheFlume简单来讲是高性能、分布式的日志采集系统,和sqoop同属于数据采集系统组件,但是sqoop用来采集关系型数据库数据,..
分类:Web程序   时间:2016-12-22 20:51:32    阅读次数:210
Banana:Solr的Kibana
最近Hue+Solr 方案原型验证有了一些进展。正好也收到了Google的大数据专家Sam的来件询问进展,我答复如下: Sam, 你好。 已经把Kafka+flume+solr的实时索引搭建起来了, 现在用实时事件统计的场景在测试数据(当前方案为kafka storm mysql),solr现在数据... ...
分类:其他好文   时间:2016-12-19 21:36:08    阅读次数:383
1276条   上一页 1 ... 67 68 69 70 71 ... 128 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!