Kafka快速入门(一)——Kafka简介一、ApacheKafka简介1、ApacheKafka简介ApacheKafka是一款开源的消息引擎系统,同时也是分布式流处理平台。消息引擎系统是一组在不同系统之间传递语义准确的消息,实现松耦合的异步式数据传递的规范。2、Kafka设计目标Kafka的设计目标如下:(1)以时间复杂度为O(1)的方式提供消息持久化能力,即使对TB级以上数据也能保证常数时间
分类:
其他好文 时间:
2020-05-10 10:23:30
阅读次数:
116
1.写在前面 在利用spark计算引擎将kafka或其他源数据组件的数据入hive形成数仓的过程中有两种方式,一种方式是利用spark Rdd的API将数据写入hdfs形成hdfs文件,之后再将文件和hdfs文件和hive表做加载映射。第二种方式是利用sparkSQL将获取的数据Rdd转换成data ...
分类:
数据库 时间:
2020-05-09 19:20:15
阅读次数:
100
Kafka 152.kafka 可以脱离 zookeeper 单独使用吗?为什么? kafka 不能脱离 zookeeper 单独使用,因为 kafka 使用 zookeeper 管理和协调 kafka 的节点服务器。 153.kafka 有几种数据保留的策略? kafka 有两种数据保存策略: 1 ...
分类:
编程语言 时间:
2020-05-08 20:07:20
阅读次数:
113
前言 涵盖各大公司会问到的面试点,同时随着版本的升级,可能也会有一些面试题更新,也会同步保持更新,因为篇幅原因(其实是我懒,哈哈)所以列了一部分答案,所有的答案见下文,总共485页合计20个技术点,文末自取pdf. 1、如何获取 topic 主题的列表 bin/kafka-topics.sh --l ...
分类:
编程语言 时间:
2020-05-08 18:13:47
阅读次数:
87
该压缩包内包含以下文件: 1.install_java.txt 配置java环境,logstash使用 2.es.txt 三节点的es集群 3.filebeat.txt 获取日志输出到kafka集群 4.install_zookeeper_cluster.txt zk集群 5.install_kaf ...
分类:
其他好文 时间:
2020-05-08 18:07:38
阅读次数:
99
一、环境准备主机名IP运行服务kafka1192.168.171.131kafka+zookeeperkafka2192.168.171.134kafka+zookeeperkafka3192.168.171.135kafka+zookeeper二、部署zookeeper服务源码包(提取码:6q58)1、kafka1配置如下#部署zookeeper[root@kafka1~]#tarzxfzook
分类:
其他好文 时间:
2020-05-08 10:13:27
阅读次数:
75
Kafka基于Zookeeper协调的分布式日志系统,可以当做MQ。主要就是做:日志收集系统、消息系统。还有就是用于用户活动跟踪:记录web用户或者app用户的各种活动,相信大家都感受到了吧。上篇我们已经提到,消息系统的两种传递模式:点对点、订阅/发布。这里将不再赘述。【对比】名称Column2RabbitMQ使用Erlang编写的一个开源的消息队列,适合企业级的开发,同时实现了Broker构架,
分类:
其他好文 时间:
2020-05-08 09:42:36
阅读次数:
66
Docker容器 阿里P8架构师谈:Docker简介、组成架构、使用步骤、以及生态产品 阿里P8架构师谈:Docker容器的原理、特征、基本架构、与应用场景 消息中间件 阿里P8架构师谈:消息中间件介绍、典型使用场景、以及使用原则 阿里P8架构师谈:分布式消息Kafka的原理、基础架构、使用场景 阿 ...
分类:
其他好文 时间:
2020-05-07 15:44:27
阅读次数:
110
一、kafka介绍及原理kafka是由Apache软件基金会发布的一个开源流处理平台,由Scala和Java编写。它是一种高吞吐量的分布式发布的订阅消息系统,它可以处理消费者规模的网站中的所有动作流数据。这种动作(网页浏览,搜索和其他用户的行动)是在现代网络上的许多社会功能的一个关键因素。这些数据通常是由于吞吐量的要求而通过处理日志和日志聚合来解决。对于像Hadoop一样的日志数据和离线分析系统,
分类:
其他好文 时间:
2020-05-07 09:17:48
阅读次数:
76