码迷,mamicode.com
首页 >  
搜索关键字:flume    ( 1090个结果
批量上传文件到HDFS的Shell脚本
在做Hadoop数据挖掘项目的时候,我们第一步是源数据的获取,即把相应的数据放置到HDFS中,以便Hadoop进行计算,手动将文件上传到HDFS中,未免太费时费力,所以我们可以采取像Flume一样的框架,或者采用Shell脚本进行文件的上传。下面主要提供Shell脚本的大致写法,仅供参考,可以根据不 ...
分类:Web程序   时间:2017-04-19 09:52:43    阅读次数:778
Hadoop日志分析系统启动脚本
Hadoop日志分析系统启动脚本 #!/bin/bash #Flume日志数据的根文件夹 root_path=/flume #Mapreduce处理后的数据文件夹 process_path=/process #hive分区时间 partition=`date "+%Y-%m-%d"` #获取前一小时 ...
分类:其他好文   时间:2017-04-17 14:10:18    阅读次数:175
日志实时收集和计算的简单方案
作为互联网公司,网站监测日志当然是数据的最大来源。我们目前的规模也不大,每天的日志量大约1TB。后续90%以上的业务都是需要基于日志来完 成,之前,业务中对实时的要求并不高,最多也就是准实时(延迟半小时以上),因此,我们使用Flume将数据收集到HDFS,然后进行清洗和分析。 后来,根据业务需要,我 ...
分类:其他好文   时间:2017-04-17 09:27:12    阅读次数:137
flume 日志导入elasticsearch
Flume配置 。 flume生成的数据结构 <span style="font-size:18px;">"_index" : "logstash-2013.01.07", "_type" : "tms_jboss_syslog", "_id" : "a_M9X_0YSpmE7A_bEzIFiw", ...
分类:Web程序   时间:2017-04-16 11:14:52    阅读次数:233
分布式架构现在很火吗?zookeeper dubbo可以?Dubbo、zookeeper、Proxy、RestFul
SOA服务框架:Dubbo、zookeeper、Proxy、RestFul缓存:Redis、ehcache分布式消息中间件:KafKa+Flume+ZookeeperKeepalived+Nginx+Proxy负载分布式文件:FastDFSSSO框架:CAS单点登录模块化管理:Maven数据库连接池:AlibabaDruid核心框架:Springframework安全框架:ApacheShir..
分类:其他好文   时间:2017-04-12 05:22:38    阅读次数:318
Flume分布式日志收集系统
1.flume是分布式的日志收集系统,把收集来的数据传送到目的地去。2.flume里面有个核心概念,叫做agent。agent是一个java进程,运行在日志收集节点。通过agent接收日志,然后暂存起来,再发送到目的地。3.agent里面包含3个核心组件:source、channel、sink。 3 ...
分类:Web程序   时间:2017-04-10 13:08:21    阅读次数:178
flume日志采集框架使用
flume日志采集框架使用 本次学习使用的全部过程均不在集群上,均在本机环境,供学习参考 先决条件: flume-ng-1.6.0-cdh5.8.3.tar 去cloudrea下载flume框架,笔者是用cdh5.8.3的套餐 flume-ng-1.6.0-cdh5.8.3.tar 去cloudre ...
分类:Web程序   时间:2017-04-02 14:38:46    阅读次数:242
flume自定义source
package me; import java.nio.charset.Charset; import java.util.HashMap; import java.util.Random; import org.apache.flume.Context; import org.apache.flu... ...
分类:Web程序   时间:2017-03-30 17:13:26    阅读次数:488
flume自定义sink之mysql
package me; import static org.mockito.Matchers.booleanThat; import java.sql.Connection; import java.sql.DriverManager; import java.sql.SQLException; i... ...
分类:数据库   时间:2017-03-30 13:32:50    阅读次数:344
- Exception follows. org.apache.flume.FlumeException: java.net.BindException: Address already in use
[ERROR - org.apache.flume.lifecycle.LifecycleSupervisor$MonitorRunnable.run(LifecycleSupervisor.java:251)] Unable to start EventDrivenSourceRunner: { ...
分类:编程语言   时间:2017-03-30 13:30:07    阅读次数:840
1090条   上一页 1 ... 52 53 54 55 56 ... 109 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!