搜索关键字：flume kafka topic覆盖，搜索到5097个结果！码迷,mamicode.com！

kafka的基本概念

kafka的基本概念 kafka是什么？ ? kafka是一个多分区、多副本且基于zookeeper协调的分布式消息系统。也是一个分布式流式处理平台，它以高吞吐、可持久化、可水平扩展、支持流数据处理等多种特性而被广泛使用。 kafka扮演的三大角色消息系统：kafka具备系统解耦、冗余存储、流 ...

分类：其他好文时间：2020-03-20 10:47:33 阅读次数：76

Flume 监听本地目录到 HDFS

a1.sources = s1a1.channels = c1a1.sinks = k1 a1.sources.s1.channels = c1a1.sources.s1.type = spooldira1.sources.s1.spoolDir = /home/abby/dataa1.source ...

分类：Web程序时间：2020-03-20 09:16:44 阅读次数：81

Kafka 核心组件之协调器

1、消费者与消费者组假设某 topic 有4个分区，消费者组中只有一个消费者，那么这个消费者将消费全部 partition 中的数据。如果消费者组中有两个消费者，那么每个消费者消费两个 partition。如果消费者组中有4个消费者，那么每个消费者消费一个partition。如果消费者组中有 ...

分类：其他好文时间：2020-03-19 21:29:18 阅读次数：65

flume 集群安装监听测试

1、在已经搭建好集群基础上，配置监听机器配置，主机名 hadoop1,flume-conf.properties配置文件 # Licensed to the Apache Software Foundation (ASF) under one # or more contributor licens ...

分类：Web程序时间：2020-03-18 23:45:55 阅读次数：95

监听kafka消息

1、main方法中（1.0以上） import org.apache.kafka.clients.consumer.Consumer; import org.apache.kafka.clients.consumer.ConsumerRecord; import org.apache.kafka.c ...

分类：其他好文时间：2020-03-18 21:36:32 阅读次数：83

Kafka 消费时机问题

## kafka的消费时机#### 问题 kafka启动后开始消费的话，如果此时消费流程中有其他依赖没有启动完成的话，比如 Redis , Mysql ，RPC等就会有空指针或其他问题。这时候就要延后kafka的消费时机。#### 解决kafka启动时，不在启动时开启消费线程。```public ... ...

分类：其他好文时间：2020-03-18 13:51:51 阅读次数：60

spark streaming连接kafka引发"partition.assignment.strategy"异常处理

服务器运行环境：spark 2.4.4 + scall 2.11.12 + kafka 2.2.2 由于业务相对简单，kafka只有固定topics，所以一直使用下面脚本执行实时流计算 spark-submit --packages org.apache.spark:spark-streaming- ...

分类：其他好文时间：2020-03-18 11:45:06 阅读次数：53

4.【Redis系列】Redis的高级应用-延时队列

原文:4.【Redis系列】Redis的高级应用-延时队列我们习惯于用rabbitmq和kafka作为消息中间件，来给应用之间增加异步的能力。但是使用过的同学都知道，使用专业的消息中间件使用起来非常复杂，我们实现一个简单的功能都需要大量的操作。有了redis，可以让我解脱出来，使用redis可以非... ...

分类：其他好文时间：2020-03-18 10:00:40 阅读次数：58

kafka安装

kafka依赖zookeeper，需要先安装zookeeper，参考:https://www.cnblogs.com/yinchh/p/12494681.html 单机集群三台服务器分别为 192.168.0.201 192.168.0.202 192.168.0.203 1.分别修改3台机器的 ...

分类：其他好文时间：2020-03-16 23:21:24 阅读次数：70

kafka实现无消息丢失与精确一次语义（exactly once）处理

在很多的流处理框架的介绍中，都会说kafka是一个可靠的数据源，并且推荐使用Kafka当作数据源来进行使用。这是因为与其他消息引擎系统相比，kafka提供了可靠的数据保存及备份机制。并且通过消费者位移这一概念，可以让消费者在因某些原因宕机而重启后，可以轻易得回到宕机前的位置。但其实kafka的可靠 ...

分类：其他好文时间：2020-03-16 19:18:08 阅读次数：78

共5097条上一页 1 ... 64 65 66 67 68 ... 510 下一页

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)