搜索关键字：kafka producer，搜索到4768个结果！码迷,mamicode.com！

Kafka的分布式架构设计与High Availability机制

最初，Kafka实际上是LinkedIn用于日志处理的分布式消息队列，现今，Kafka主要用于处理活跃的流式数据，如分析用户的行为，对用户搜索关键词进行统计以便分析出当前的流行趋势，存数据库浪费，而直接用传统的存硬盘方式效率又低下的业务数据也可以使用Kafka的分布式进行存储。...

分类：其他好文时间：2015-06-18 19:57:08 阅读次数：240

Kafka实战－Storm Cluster

1.概述在《Kafka实战－实时日志统计流程》一文中，谈到了Storm的相关问题，在完成实时日志统计时，我们需要用到Storm去消费Kafka Cluster中的数据，所以，这里我单独给大家分享一篇Storm Cluster的搭建部署。以下是今天的分享目录：Storm简述基础软件安装部署效果预览....

分类：其他好文时间：2015-06-18 13:04:35 阅读次数：125

【原创】Kafka producer原理 (Scala版同步producer)

本文分析的Kafka代码为kafka-0.8.2.1。另外，由于Kafka目前提供了两套Producer代码，一套是Scala版的旧版本；一套是Java版的新版本。虽然Kafka社区极力推荐大家使用Java版本的producer，但目前很多已有的程序还是调用了Scala版的API。今天我们就分析一下...

分类：其他好文时间：2015-06-17 15:20:57 阅读次数：145

【转】KAFKA分布式消息系统

Kafka[1]是linkedin用于日志处理的分布式消息队列，linkedin的日志数据容量大，但对可靠性要求不高，其日志数据主要包括用户行为（登录、浏览、点击、分享、喜欢）以及系统运行日志（CPU、内存、磁盘、网络、系统及进程状态）。当前很多的消息队列服务提供可靠交付保证，并默认是即时消费（不适...

分类：其他好文时间：2015-06-17 11:04:37 阅读次数：132

【Flume】flume ng 1.6 做了哪些变化

依旧和大家一起看一下官网的内容： http://flume.apache.org/ ·增加了apache kafka的sink和source两大组件 ·增加了一个新的channel——kafka channel ·增加了hive的sink组件，需要hive streaming的支持 ·端到端的认证 ·简单的正则搜索和替换的拦截器开始体验吧！...

分类：Web程序时间：2015-06-16 19:18:23 阅读次数：190

kafka配置参数

Kafka为broker,producer和consumer提供了很多的配置参数。了解并理解这些配置参数对于我们使用kafka是非常重要的。本文列出了一些重要的配置参数。官方的文档Configuration比较老了，很多参数有所变动，有些名字也有所改变。我在整理的过程中根据0.8.2的代码也做了...

分类：其他好文时间：2015-06-13 20:09:26 阅读次数：113

[Java基础] java多线程关于消费者和生产者

多线程：生产与消费1.生产者Producer生产produce产品，并将产品放到库存inventory里；同时消费者Consumer从库存inventory里消费consume产品。2.库存inventory的总量（最大库存量100）是有限的。如果库存inventory满了，生产者不能在库存inv...

分类：编程语言时间：2015-06-13 20:05:47 阅读次数：179

apache kafkac系列lient发展-java

apache kafka区QQ群:1622725571.依赖包 org.apache.kafka kafka_2.10 0.8.1 2.producer程序开发样例2.1 producer參数说明#指定kafka节点列表。用于获取metadata，不必所有...

分类：编程语言时间：2015-06-13 11:13:23 阅读次数：171

Kafka topic常见命令解析

本文着重介绍几个常用的topic命令行命令，包括listTopic，createTopic，deleteTopic和describeTopic等。由于alterTopic并不是很常用，本文中就不涉及了。另外本文的代码分析是基于kafka_2.10-0.8.2.1的(虽然截图是Kafka 0.8.1的...

分类：其他好文时间：2015-06-12 13:15:56 阅读次数：121

为什么是kafka(二)

回答几个网友提出的问题，不清楚的可以看上一篇内容。 1、 kafka的删除策略应该怎么配置？为了提升性能，我是不是应该1小时删除一次消费过的数据。完全可以根据磁盘大小配置，只要磁盘足够用，完全没必要删除的那么着急。Kafka的吞吐量不会因为数据量的增长而降低。因为读写数据时，kafka完全是顺序的，只记录offset，时间复杂度是O（1），我曾经测试过上T的数据，完全不受影响。反倒是数...

分类：其他好文时间：2015-06-12 10:11:11 阅读次数：112

共4768条上一页 1 ... 439 440 441 442 443 ... 477 下一页

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)