这个文档是?Cloudera Distribution of Apache Kafka?1.3.x. 其他版本的文档在Cloudera Documentation. Using Kafka with Flume 在CDH 5.2.0 及更高的版本中, Flume 包含一个Kafka source and sink。使用它们可以...
分类:
Web程序 时间:
2015-08-29 17:21:58
阅读次数:
338
问题导读:1.Flume传输的数据的基本单位是是什么?2.Event是什么,流向是怎么样的?3.Source:完成对日志数据的收集,分成什么打入Channel中?4.Channel的作用是什么?5.取出Channel中的数据,进行相应的存储文件系统,数据库,或者提交到远程服务器,由谁来完成?6.Fl...
分类:
Web程序 时间:
2015-08-28 21:21:41
阅读次数:
208
ApacheFlume是一个分布式的、可靠的、高效的系统,可以将不同来源的数据收集、聚合并移动到集中的数据存储中心上。ApacheFlume不仅仅只是用到日志收集中。由于数据来源是可以定制的,flume可以使用传输大量的自定义event数据,包括但不限于网站流量信息、社会媒体信息、email信息以及...
分类:
Web程序 时间:
2015-08-28 19:28:39
阅读次数:
229
由于做数据处理时,经常遇到maven 下载依赖包错误,下面我将自己下载好的repository 分享下 里边包含:Hadoop ,storm ,sprk ,kafka ,等 压缩后500多M。 http://pan.baidu.com/s/1pJN2ScV 如有问题请联系: chaoren399@1...
分类:
其他好文 时间:
2015-08-28 00:36:13
阅读次数:
113
Flume是一个分布式的、可靠的、可用的服务,用于从许多不同的源上有效地搜集、汇总、移动大量数据日志到一个集中式的数据存储中。并且它是一个简单的和灵活的基于流的数据流架构。它具有鲁棒性和容错机制以及故障转移和恢复的机制。对于分析的应用中它使用一个简单的可扩展的数..
分类:
Web程序 时间:
2015-08-27 19:17:07
阅读次数:
266
问题导读:1.Flume-NG与Scribe对比,Flume-NG的优势在什么地方?2.架构设计考虑需要考虑什么问题?3.Agent死机该如何解决?4.Collector死机是否会有影响?5.Flume-NG可靠性(reliability)方面做了哪些措施?美团的日志收集系统负责美团的所有业务日志的...
分类:
Web程序 时间:
2015-08-27 18:36:58
阅读次数:
375
kafka是一种高吞吐量的分布式发布订阅消息系统,她有如下特性:通过O(1)的磁盘数据结构提供消息的持久化,这种结构对于即使数以TB的消息存储也能够保持长时间的稳定性能。高吞吐量:即使是非常普通的硬件kafka也可以支持每秒数十万的消息。支持通过kafka服务器和消费机集群来分区消息。支持Hadoo...
分类:
Web程序 时间:
2015-08-27 18:32:36
阅读次数:
184
个人观点:大数据我们都知道hadoop,但并不都是hadoop.我们该如何构建大数据库项目。对于离线处理,hadoop还是比较适合的,但是对于实 时性比较强的,数据量比较大的,我们可以采用Storm,那么Storm和什么技术搭配,才能够做一个适合自己的项目。下面给大家可以参考。可以带着下面问题来阅读...
分类:
Web程序 时间:
2015-08-27 18:32:29
阅读次数:
302
问题导读:1.Flume-NG与Scribe对比,Flume-NG的优势在什么地方?2.架构设计考虑需要考虑什么问题?3.Agent死机该如何解决?4.Collector死机是否会有影响?5.Flume-NG可靠性(reliability)方面做了哪些措施?美团的日志收集系统负责美团的所有业务日志的...
分类:
Web程序 时间:
2015-08-27 18:07:42
阅读次数:
249
往kafka发送消息时失败,抛出错误信息:kafka.common.FailedToSendMessageException: Failed to send messages after 3 tries。列出分析过程和解决方案,遇到问题的朋友可参考。...
分类:
其他好文 时间:
2015-08-27 13:33:24
阅读次数:
24863