Requirements Software Requirements Flink runs on all UNIX-like environments, e.g. Linux, Mac OS X, and Cygwin (for Windows) and expects the cluster to ...
分类:
其他好文 时间:
2018-09-26 18:20:05
阅读次数:
193
前言 最新开始捣鼓flink,fucking the code之前,编译是第一步。 编译环境 win7 java maven 编译步骤 https://ci.apache.org/projects/flink/flink-docs-release-1.6/start/building.html 官方 ...
分类:
Windows程序 时间:
2018-09-21 11:40:48
阅读次数:
1383
streamTask的invoke方法中,会循环去调用task上的每个operator的initializeState方法,在这个方法中,会真正创建除了savepointStream的其他三个对象, 而savepointStream会lazy到做savepoint的时候才创建对象,这个也可以理解,毕 ...
分类:
其他好文 时间:
2018-09-14 23:00:41
阅读次数:
149
Netty是什么? Netty是由JBOSS提供的一个java开源框架。 Netty提供异步的、事件驱动的网络应用程序框架和工具,用以快速开发高性能、高可靠性的网络服务器和客户端程序。 封装了JDK底层BIO和NIO模型,提供高度可用的API。 自带编解码器解决拆包粘包问题,用户只用关心业务逻辑。 ...
分类:
Web程序 时间:
2018-09-12 21:44:01
阅读次数:
209
Pinpoint是韩国人开发的一套基于java的Apm(应用性能监控),具有低延迟、实时监控、拓扑发现、低性能损耗的特点(官方预估是3%),同事有一个完善的web后台,一目了然查看应用拓扑。 安装使用前我搜索了网上一堆的文档,几乎都是半路货或是比较旧,一半靠官网,一半靠摸索理解,还好感谢官网的协助, ...
分类:
其他好文 时间:
2018-09-12 13:12:22
阅读次数:
671
用SQL分析数据流 越来越多的公司在采用流处理技术,并将现有的批处理应用程序迁移到流处理或者为新的应用设计流处理方案。其中许多应用程序专注于分析流数据。分析的数据流来源广泛,如数据库交易,点击,传感器测量或物联网设备。 Apache Flink非常适合流式分析,因为它提供了事件时间语义支持,恰一次的 ...
分类:
其他好文 时间:
2018-09-11 14:13:50
阅读次数:
169
并行执行 本节介绍如何在Flink中配置程序的并行执行。FLink程序由多个任务(转换/操作符、数据源和sinks)组成。任务被分成多个并行实例来执行,每个并行实例处理任务的输入数据的子集。任务的并行实例的数量称之为并行性。 如果要使用保存点,还应该考虑设置最大并行性(或最大并行性)。当从保存点还原 ...
分类:
其他好文 时间:
2018-09-11 14:08:43
阅读次数:
228
本文主要是想聊聊flink与kafka结合。当然,单纯的介绍flink与kafka的结合呢,比较单调,也没有可对比性,所以的准备顺便帮大家简单回顾一下Spark Streaming与kafka的结合。 看懂本文的前提是首先要熟悉kafka,然后了解spark Streaming的运行原理及与kafk ...
分类:
其他好文 时间:
2018-09-11 14:03:58
阅读次数:
188
参考这篇文章: https://www.sohu.com/a/196257023_470008 我们当时的目标就是要设计一款低延迟、exactly once、流和批统一的,能够支撑足够大体量的复杂计算的引擎。 Spark streaming 的本质还是一款基于 microbatch 计算的引擎。这种 ...
分类:
其他好文 时间:
2018-09-06 21:02:13
阅读次数:
227
1、流计算SQL原理和架构 流计算SQL通常是一个类SQL的声明式语言,主要用于对流式数据(Streams)的持续性查询,目的是在常见流计算平台和框架(如Storm、Spark Streaming、Flink、Beam等)的底层API上, 通过使用简易通用的的SQL语言构建SQL抽象层,降低实时开发 ...
分类:
数据库 时间:
2018-09-05 11:41:23
阅读次数:
281