码迷,mamicode.com
首页 >  
搜索关键字:spark kafka    ( 10972个结果
快手基于 Flink 的持续优化与实践
简介: 快手基于 Flink 的持续优化与实践的介绍。 一、Flink 稳定性持续优化 第一部分是 Flink 稳定性的持续优化。该部分包括两个方面,第一个方面,主要介绍快手在 Flink Kafka Connector 方面做的一些高可用,是基于内部的双机房读或双机房写和一些容错的策略。第二部分关 ...
分类:其他好文   时间:2021-03-05 12:54:40    阅读次数:0
Hudi on flink v0.7.0 使用遇到的问题及解决办法
近日,Hudi社区合并了 Flink 引擎的基础实现(HUDI-1327),这意味着 Hudi 开始支持 Flink 引擎。 当前 Flink 版本的 Hudi 只支持读取 Kafka 数据,sink到 COW 类型的 Hudi 表中,其他功能还在完善。 这里我们简要介绍下如何从 Kafka 读取数 ...
分类:其他好文   时间:2021-03-04 13:29:01    阅读次数:0
Spark Core 02(理论),独立的进程集
Application Application=a driver program + executors 一般来说:1个SparkContext = 1个application=1个SparkShell Spark提交任务不一定须在集群里提交,有gateway就行 1个application ==> ...
分类:系统相关   时间:2021-03-04 13:20:14    阅读次数:0
Spark 运行时相关概念
Spark 运行时相关概念 从集群的物理层面 Master 节点:部署 Cluster Manager的节点 Slave 节点:部署 Worker 的节点,每个节点可以有多个 Worker 进程 从进程层面(与所执行的应用无关) Cluster Manager:管理集群的 CPU、内存等资源,为不同 ...
分类:其他好文   时间:2021-03-03 12:14:39    阅读次数:0
zabbix监控kafka消费(转)
目录 一、Kafka监控的几个指标 二、查看zookeeper配置 三、查看kafka配置 四、查看kafka的group name 五、查看kafka的topic_name 六、修改zabbix配置文件 七、创建监控脚本 八、给脚本和对应文件权限 九、重启zabbix 十、监控上增加3个键值 正文 ...
分类:其他好文   时间:2021-03-03 12:11:41    阅读次数:0
大数据概述
1.用图表描述Hadoop生态系统的各个组件及其关系。 2.阐述Hadoop生态系统中,HDFS, MapReduce, Yarn, Hbase及Spark的相互关系。 HDFS(Hadoop分布式文件系统)是Hadoop体系中 数据存储管理的基础。它是一个高度容错的系统,能检测和应对硬件故障,用于 ...
分类:其他好文   时间:2021-03-02 12:24:42    阅读次数:0
大数据概述
1.用图表描述Hadoop生态系统的各个组件及其关系。 2.阐述Hadoop生态系统中,HDFS, MapReduce, Yarn, Hbase及Spark的相互关系。 Hadoop对应于Google三驾马车:HDFS对应于GFS,即分布式文件系统,MapReduce即并行计算框架,HBase对应于 ...
分类:其他好文   时间:2021-03-02 12:20:23    阅读次数:0
01 大数据概述
1.用图表描述Hadoop生态系统的各个组件及其关系。 2.阐述Hadoop生态系统中,HDFS, MapReduce, Yarn, Hbase及Spark的相互关系。 Hadoop对应于Google三驾马车:HDFS对应于GFS,即分布式文件系统,MapReduce即并行计算框架,HBase对应于 ...
分类:其他好文   时间:2021-03-02 12:10:47    阅读次数:0
如何系统的了解Kafka
1.概述 在大数据的浪潮下,时时刻刻都会产生大量的数据。比如社交媒体、博客、电子商务等等,这些数据会以不同的类型存储在不同的平台里面。为了执行ETL(提取、转换、加载)操作,需要一个消息中间件系统,该系统应该是异步和低耦合的,即来自各种存储系统(如HDFS、Cassandra、RDBMS等)的数据可 ...
分类:其他好文   时间:2021-03-01 13:50:00    阅读次数:0
springcloud-stream为什么被引入
现在的mq产品主流有4中:rabbitmq,rocketmq,activemq,kafka;有时候很意外的是:学的其中一个,公司用的又是另外一个,导致学习成本提高。有或者是 业务服务使用rabbitmq,而数据库后台使用kafka,整个项目使用了2种mq,可能会导致切换困难,维护成本高等因素。 我们 ...
分类:编程语言   时间:2021-02-27 12:58:02    阅读次数:0
10972条   上一页 1 ... 16 17 18 19 20 ... 1098 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!