1、应用场景实时数据流通过kafka后,根据业务需求,一部分直接借助kafka-connector入Elasticsearch不同的索引中。另外一部分,则需要先做聚类、分类处理,将聚合出的分类结果存入ES集群的聚类索引中。如下图所示:业务系统的分层结构可分为:接入层、数据处理层、数据存储层、接口层。那么问题来了?我们需要基于聚合(数据处理层)的结果实现检索和聚合分析操作,如何实现更快的检索和更高效
分类:
其他好文 时间:
2020-08-03 09:46:14
阅读次数:
76
数据一致性问题:消费一致性和存储一致性 例如:一个leader 写入 10条数据,2个follower(都在ISR中),F1、F2都有可能被选为Leader,例如选F2 .后面Leader又活了。可能造成每个副本数据不一致 F1 8条 F2 9条 LEO:每个副本的最后一个offset。例如 F1的 ...
分类:
其他好文 时间:
2020-08-03 00:49:16
阅读次数:
120
0、题记实际业务场景中,会遇到基础数据存在Mysql中,实时写入数据量比较大的情景。迁移至kafka是一种比较好的业务选型方案。而mysql写入kafka的选型方案有:方案一:logstash_output_kafka插件。方案二:kafka_connector。方案三:debezium插件。方案四:flume。方案五:其他类似方案。其中:debezium和flume是基于mysqlbinlog实
分类:
数据库 时间:
2020-08-01 12:38:39
阅读次数:
93
查看消费组详情: ./bin/kafka-consumer-groups.sh --bootstrap-server localhost:9092 --describe --group test-consumer-group 查看topic详情: ./bin/kafka-topics.sh --to ...
分类:
其他好文 时间:
2020-07-31 18:03:33
阅读次数:
83
一次机房停电引发的思考今天早上到公司的时候,接到开发反馈DEV环境所有接口都卡,耗时都在一分钟以上,严重影响开发正常工作,然后通过网关的日志定位到原因是因为kafka集群不可用(总共3个broker,前一天晚上机房停电导致leader节点挂了),导致网关的反爬过滤器里面发送kafka消息的代码kafkaTemplat.send阻塞了60s,当时在想这个send方法不是异步的吗,为什么会阻塞60s?
分类:
其他好文 时间:
2020-07-31 01:13:59
阅读次数:
93
0、题记日志分析是ELK最常用、最核心业务场景之一。如果你正在使用ElasticStack并且正尝试将自定义Logstash日志映射到Elasticsearch,那么这篇文章适合你。Logstash写入ES之前的中间数据处理过程一般叫做:数据ETL或者数据清洗。本文重点介绍数据清洗环节的非结构数据转化为结构化数据的——Grok实现。1、认知前提老生常谈,夯实基础认知。ELKStack是三个开源项目
分类:
其他好文 时间:
2020-07-31 01:06:57
阅读次数:
77
0、问题引出经群讨论,建议从以下几个方面展开,大家有好的想法,也欢迎留言交流。1、可视化展示ELK效果如果条件允许,demo的内容是:通过logstash同步日志或数据库(oracle、mysql)表的数据到Elasticsearch,然后通过kibana进行可视化。1通过Canvas对数据进行可视化布局与展现,可以实现非常酷炫的大屏展示效果。2展示实时数据的数据量。3展示你定的几个维度的数据信息
分类:
其他好文 时间:
2020-07-31 01:05:26
阅读次数:
101