码迷,mamicode.com
首页 >  
搜索关键字:job    ( 4794个结果
Django基础
一、Django版本与python版本对应关系 对于初学者,适合学习1.11版本(我这里对应python用的3.5.3),1.11版本既有新的特性,又不像2.0,2.1及以上版本高强度的依赖插件,致使一 些学者没有插件就过不了;而且这些插件还没有很好的支持python3.0。使用Django1.11 ...
分类:其他好文   时间:2019-10-29 23:32:16    阅读次数:91
十七、hadoop压缩相关
一、数据压缩在hadoop中的意义1、基本概述?压缩技术可以减少底层hdfs的读写字节数。并且能够降低在数据传输过程中占用的网络带宽资源,以及降低占用的磁盘空间。而在MapReduce中,shuffle以及merge过程都面临着巨大的IO压力。但是要注意增加了压缩,另外一方面会增加cpu的负载。所以在要权衡好是否采用压缩,以及采用的压缩算法的特性。2、压缩应用基本原则运算密集型的job,少用压缩。
分类:其他好文   时间:2019-10-29 13:44:07    阅读次数:84
事务手动回滚
@Override public BaseResponse transferStuPlan(GxyPlanTeacherStudentEntity teacherStudentEntity) { boolean stuIHaveJob = false; List<GxyPlanTeacherStud ...
分类:其他好文   时间:2019-10-29 11:41:08    阅读次数:84
spark--job和DAGScheduler源码
一个job对应一个action操作,action执行会有先后顺序; 每个job执行会先构建一个DAG路径,一个job会含有多个stage,主要逻辑在DAGScheduler。 spark提交job的源码见(SparkContext.scala的runJob方法): DAGScheduler--job ...
分类:其他好文   时间:2019-10-27 17:08:08    阅读次数:115
判断List是否包含某元素Job
static boolean listIn(List list, anyType element){ boolean ret = false; ListEnumerator listE = list.getEnumerator(); ; if (list.typeId() != typeof(ele ...
分类:其他好文   时间:2019-10-26 16:55:18    阅读次数:87
Redis实现分布式锁
需求 最近负责的一个项目是微服务开发,我所开发的服务里有个定时任务,如果在集群环境下仅仅使用@scheduled,会发生定时任务幂等的问题。 可以采取的解决方案: 1.通过在配置文件设置定时任务开关,只允许一台开启定时任务。考虑到使用了nacos作为配置中心,单节点定时任务对单台服务器的压力以及单点 ...
分类:其他好文   时间:2019-10-26 13:40:07    阅读次数:227
linux自动代码增量备份 结合 全量备份
需求说明系统环境:linux(centos7)备份内容:增量备份结合全量备份公司中的生产服务器数据非常重要,所以我们需要通过备份服务器将生产服务器的数据进行备份。rsync的增量备份,不单单会同步新增的内容,就连删除的内容也会同步。假如管理代码人员误操作将代码误删除,那么备份服务器检测到备份原的数据产生变化后,也会与其同步,此时生产服务器与备份服务器的代码都会丢失。增量备份要求的频率较高,但在生产
分类:系统相关   时间:2019-10-25 23:39:32    阅读次数:170
十四、MapReduce--OutputFormat和RecordWriter抽象类
一、基本原理?reduce执行完毕之后,每个reduce都会将KV输出到一个文件中。那么KV输出到文件中时是以什么格式输出的呢?这就涉及到两个抽象类:OutputFormat和RecordWriter。1、OutputFormatpublicabstractclassOutputFormat<K,V>{publicOutputFormat(){}publicabstractRecord
分类:其他好文   时间:2019-10-25 09:23:50    阅读次数:108
十二、MapReduce--mapjoin和reducejoin
一、mapjoin1、适用场景:一张表很大,一张表很小2、解决方案:在map端缓存多张表,提前处理业务逻辑,这样增加map端业务,减少reduce端的数据压力,尽可能减少数据倾斜。3、具体方法:采用分布式缓存(1)在mapper的setup阶段,将文件读取到缓存集合中(2)在driver中加载缓存,job.addCacheFile(newURI("file:/e:/mapjoincach
分类:其他好文   时间:2019-10-25 09:18:03    阅读次数:61
九、MapReduce--input源码分析
当job提交至yarn之后,就会开始调度运行map任务,这里开始讲解map输入的源码分析。一个map任务的入口就是MapTask.class中的run()方法1、首先看看MapTask.run()方法MapTask.class//---------------------------------MapTask.javapublicvoidrun(JobConfjob,TaskUmbilicalPr
分类:其他好文   时间:2019-10-24 20:00:59    阅读次数:69
4794条   上一页 1 ... 49 50 51 52 53 ... 480 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!