码迷,mamicode.com
首页 >  
搜索关键字:spark streaming 作业 容错    ( 29616个结果
Spark_Spring
...
分类:编程语言   时间:2020-10-31 01:17:13    阅读次数:21
分布式锁的多种实现方式
分布式锁的多种实现方式点击上方“Hollis”关注我,精彩内容第一时间呈现。全文字数:5000阅读时间:10分钟目前几乎很多大型网站及应用都是分布式部署的,分布式场景中的数据一致性问题一直是一个比较重要的话题。分布式的CAP理论告诉我们“任何一个分布式系统都无法同时满足一致性(Consistency)、可用性(Availability)和分区容错性(Partitiontolerance),最多只能
分类:其他好文   时间:2020-10-30 12:03:29    阅读次数:19
Checkpointing
上级:https://www.cnblogs.com/hackerxiaoyon/p/12747387.html 每个函数和算子都可以有状态在flink中。状态的函数存储数据通过独立的元素或事件处理。为了让状态具有容错性,flink需要把状态进行快照。检查点允许flink恢复状态和位置在流中,从而是 ...
分类:其他好文   时间:2020-10-29 09:52:49    阅读次数:16
源码编译搭建Spark3.x环境
Spark源码编译官方文档:https://spark.apache.org/docs/latest/building-spark.html用于编译源码的机器最好满足如下配置:CPU>=4核内存>=8G首先安装好JDK、Scala和Maven,由于安装都比较简单,本文就不演示了,我这里使用的JDK、Scala和Maven版本如下:[root@spark01~]#java-version
分类:其他好文   时间:2020-10-27 11:54:44    阅读次数:43
吴忠办吴忠证UUX
办吴忠证〖溦: bzs8777〗哪里办吴忠证件〖電/溦:182.1648.9071同号〗本地办理各类.证.件《诚.信.第一/专.业.定.制》自从数据源读取数据,到最终写出数据到表,无处不是使用Spark RDD作为主要数据结构,甚至连普通的工具类,都使用Spark API实现,可以说Hudi就是用S ...
分类:其他好文   时间:2020-10-27 11:31:30    阅读次数:27
spark sql 判断一列是否包含某字符
spark sql 的function中有一个 instr 可以判断其中一列是否是另外一列的子字符 新增字段 判断一个字段是否包含另一个字段的字符串,如果包含值为1否则是0 Df.withColumn("newColumn",when(instr(col("aColumn"),col("bColum ...
分类:数据库   时间:2020-10-27 10:54:18    阅读次数:55
Java01-接口(DAO模式代码阅读及应用)
#DAO模式是接口的一个典型应用。 ##阅读附件中的参考代码: ###1. StudenDaoListImpl.java与StudentDaoArrayImpl.java有何不同? 二者都用于记录学生信息并且都声明了StudentDao接口,但StudenDaoListImpl.java使用Arra ...
分类:编程语言   时间:2020-10-26 11:24:53    阅读次数:20
Spark ML 之 ALS内存溢出的解决办法
原帖:https://blog.csdn.net/Damonhaus/article/details/76572971 问题:协同过滤 ALS算法。在测试过程中遇到了内存溢出的错误 解决办法1:降低迭代次数,20次 -> 10次 val model = new ALS().setRank(10).s ...
分类:其他好文   时间:2020-10-24 09:45:55    阅读次数:24
Centos8部署Ceph集群对接OpenStack(U版本)
简介Linux持续不断进军可扩展计算空间,特别是可扩展存储空间,Ceph最近加入到Linux中令人印象深刻的文件系统备选行列,它是一个分布式文件系统,能够在维护POSIX兼容性的同时加入了复制和容错功能Ceph生态系统架构可以划分为四部分:1、Clients:客户端(数据用户)2、cmds:Metadataservercluster,元数据服务器(缓存和同步分布式元数据)3、cosd:Object
分类:其他好文   时间:2020-10-22 23:13:23    阅读次数:52
CAP原理通俗理解
在分布式系统中,有一个基本原则叫做CAP,consistence,一致性,availability,可用性,partition tolerance分区容错性。 一致性,在这里指的是分布式系统的各个副本的值要保持同步,这里强的是空间上的一致,注意和数据库中ACID中的一致性相区分,那个一致性指的是事务 ...
分类:其他好文   时间:2020-10-22 22:13:50    阅读次数:23
29616条   上一页 1 ... 21 22 23 24 25 ... 2962 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!