<! more 前言 前面 FLink 的文章中我们已经介绍了说 Flink 已经有很多自带的 Connector。 1、[《从0到1学习Flink》—— Data Source 介绍 ](http://www.54tianzhisheng.cn/2018/10/28/flink sources/) ...
分类:
其他好文 时间:
2019-01-27 19:04:26
阅读次数:
208
<! more 前言 之前写了不少 Flink 文章了,也有不少 demo,但是文章写的时候都是在本地直接运行 Main 类的 main 方法,其实 Flink 是支持在 UI 上上传 Flink Job 的 jar 包,然后运行得。最开始在第一篇 "《从0到1学习Flink》—— Mac 上搭建 ...
分类:
其他好文 时间:
2019-01-27 18:59:19
阅读次数:
199
<! more 前言 目前有许多数据分析的场景从批处理到流处理的演变, 虽然可以将批处理作为流处理的特殊情况来处理,但是分析无穷集的流数据通常需要思维方式的转变并且具有其自己的术语(例如,“windowing(窗口化)”、“at least once(至少一次)”、“exactly once(只有一 ...
<! more 前言 在第一篇介绍 Flink 的文章 "《《从0到1学习Flink》—— Apache Flink 介绍》" 中就说过 Flink 程序的结构 Flink 应用程序结构就是如上图所示: 1、Source: 数据源,Flink 在流处理和批处理上的 source 大概有 4 类:基于 ...
分类:
其他好文 时间:
2019-01-27 16:26:35
阅读次数:
177
这段时间,开始学习Flink,并了解了Spark与Flink的区别,开始觉得Flink大有取代Spark的趋势啊,实时流始终目前是Spark的瓶颈呀,下面来一张对比图: 图片来源于:https://jobs.zalando.com/tech/blog/apache-showdown-flink-vs ...
分类:
其他好文 时间:
2019-01-24 20:11:12
阅读次数:
162
https://www.slideshare.net/FlinkForward/flink-forward-berlin-2017-patrick-lucas-flink-in-containerland ...
分类:
其他好文 时间:
2019-01-22 00:37:21
阅读次数:
148
wordCount POM文件需要导入的依赖: 离线代码: java版本: scala版本: 流式: java版本: scala版本 运行,传参: 终端使用nc命令进行模拟发送数据到9999端口 运行结果: 注意事项: 千万不要把包导错了,java就导java,scala就导scala,如果导错,程 ...
分类:
其他好文 时间:
2019-01-19 12:16:14
阅读次数:
139
一、前言 2018年元旦,出现的cpu的漏洞,可以在windows环三直接读取内核数据,windows对该漏洞提供补丁,补丁增加了一个页表,对应的内核处理也增加了,接下来我们看下补丁修复的表象以及对KeServiceDescriptorTable获取的变更。 可参考https://bbs.kafan ...
分类:
其他好文 时间:
2019-01-11 18:59:00
阅读次数:
249
基于Flink流处理的动态实时亿级全端用户画像系统课程下载:https://pan.baidu.com/s/1YtMs-XG5-PsTFV9_7-AlfA提取码:639m项目中采用到的算法包含LogisticRegression、Kmeans、TF-IDF等,Flink暂时支持的算法比较少,对于以上算法,本课程将手把手带大家用Flink实现,并且结合真实场景,学完即用。本套教程的Flink算法部分
分类:
其他好文 时间:
2019-01-11 14:45:10
阅读次数:
177
重点组件:HDFS:Hadoop的分布式文件存储系统MapReduce:Hadoop的分布式程序运算框架,也可以叫做一种编程模型Hive:基于Hadoop的类SQL数据仓库工具HBase:基于Hadoop的列式分布式NoSQL数据库ZooKeeper:分布式协调服务组件Mahout:基于MapReduce/Flink/Spark等分布式运算框架的机器学习算法库Oozie/Azkaban:工作流调度
分类:
其他好文 时间:
2019-01-11 14:19:16
阅读次数:
174