今天早上系统突然挂掉,查看数据库发现数据库内存使用完了,然后看trace日志发现: os thread scheduling delay history: (sampling every 1.000000 secs) 0.000000 secs at [ 08:58:05 ] NOTE: sched ...
分类:
系统相关 时间:
2020-06-24 19:29:27
阅读次数:
122
Broadcast Join 适合情况,小表和大表,小表非常小,适合传播到各个节点。 当大表小表连接时,为了避免Shuffle,我们可以将小表广播到各个节点内存,供大表连接。一定程度上牺牲了空间,避免了Shuffle。这种Join在Spark中称作Broadcast Join。(需要注意的点是广播的 ...
分类:
其他好文 时间:
2020-06-24 16:28:44
阅读次数:
53
package test import org.apache.spark.sql.{DataFrame, ForeachWriter, Row, SparkSession} import org.apache.spark.sql.streaming.{ProcessingTime, Trigger} ...
分类:
数据库 时间:
2020-06-24 16:23:50
阅读次数:
132
深度剖析了各个基础技术的源码(ZooKeeper、Hive、Spark、Flink、Hadoop等),对这些基础技术知识动态的排列组合,形成大数据全局架构观,并深入讲述大数据全局架构设计的方方面面,打造真正满足企业万亿级海量数据规模的数据中台,真正赋能前台业务。同时,在企业万亿级真实项目落地环节,采用高性能、高可用、高扩展的架构设计原则,技术上更是融合了企业级主流的离线架构和实时架构,带领大家构建
分类:
其他好文 时间:
2020-06-23 18:39:30
阅读次数:
58
How to show git log history for a sub directory of a git repo? git log a b c ...
分类:
其他好文 时间:
2020-06-23 15:57:52
阅读次数:
44
图解 Git 的 merge 与 reabse 命令,彻底弄懂它们! ...
分类:
其他好文 时间:
2020-06-23 01:24:20
阅读次数:
106
本课程针对企业不同数据规模技术方案进行讲解,紧贴企业热门需求,深入讲解企业级大数据技术的数据存储技术、数据采集技术、数据处理技术、任务调度技术等;课程针对知识点进行企业级案例式教学,理论结合实战,从0到1构建大数据生态技术的方方面面,内容涵盖大数据平台、Spark、Flink、OLAP等核心技术;用真实的企业级实时数仓项目、离线数仓项目、PB级实时用户行为分析系统、千亿级实时广告系统等多个大型项目
分类:
其他好文 时间:
2020-06-22 19:15:45
阅读次数:
50
本课程针对企业不同数据规模技术方案进行讲解,紧贴企业热门需求,深入讲解企业级大数据技术的数据存储技术、数据采集技术、数据处理技术、任务调度技术等;课程针对知识点进行企业级案例式教学,理论结合实战,从0到1构建大数据生态技术的方方面面,内容涵盖大数据平台、Spark、Flink、OLAP等核心技术;用 ...
分类:
其他好文 时间:
2020-06-22 18:50:44
阅读次数:
295
BOM BOM:浏览器对象模型(Browser Object Model) BOM提供了独立于内容的、可以与浏览器窗口进行互动的对象结构 BOM可实现功能 弹出新的浏览器窗口 移动、关闭浏览器窗口以及调整窗口的大小 页面的前进、后退 windows对象 常用属性 属性名称说 明 history 有关 ...
分类:
其他好文 时间:
2020-06-22 12:23:11
阅读次数:
100
? 如何用形象的比喻描述大数据的技术生态?Hadoop、Hive、Spark 之间是什么关系?对于大部分人来说都是傻傻分不清楚。 今年来大数据、人工智能获得了IT界大量的关注。如果一个企业不玩大数据,都不好意思说自己是在IT圈混的。我敢打赌,你在中关村西二旗地铁站溜一圈,保准你会听到如下名词:Had ...
分类:
其他好文 时间:
2020-06-20 23:54:38
阅读次数:
100