码迷,mamicode.com
首页 >  
搜索关键字:spark job    ( 11541个结果
[Spark] pyspark insertInto 去重插入数据表
pyspark有个bug, 虽然下面代码写了 write.mode("overwrite")但是不生效 spark.conf.set("hive.exec.dynamic.partition.mode", "constrict") db_df.repartition(1).write.mode("o ...
分类:其他好文   时间:2021-02-23 14:14:20    阅读次数:0
Mysql:多表查询
本文主要记录关于多表查询的相关知识: 所用到的数据库代码如下: -- 部门表 CREATE TABLE dept ( id INT PRIMARY KEY PRIMARY KEY, -- 部门id dname VARCHAR(50), -- 部门名称 loc VARCHAR(50) -- 部门所在地 ...
分类:数据库   时间:2021-02-20 12:08:51    阅读次数:0
Spark07-SparkSQL
在介绍 Spark SQL之前,我们先了解两种基本的数据分析方式。 一、数据分析的两种方式 数据分析的方式大致上可以划分为 SQL 和 命令式两种。 命令式 在前面的 RDD部分,非常明显可以感觉的到是命令式的,主要特征是通过一个算子,可以得到一个结果,通过结果再进行后续计算。例如: sc.para ...
分类:数据库   时间:2021-02-16 12:29:50    阅读次数:0
大数据开发-从cogroup的实现来看join是宽依赖还是窄依赖
前面一篇文章提到大数据开发-Spark Join原理详解,本文从源码角度来看cogroup 的join实现 1.分析下面的代码 import org.apache.spark.rdd.RDD import org.apache.spark.{SparkConf, SparkContext} obje ...
分类:其他好文   时间:2021-02-16 12:23:59    阅读次数:0
[Bash] Schedule Timed Jobs on macOS with `launchd`
Schedule timed jobs on macOS with launchd launchd is a robust scheduled job automation tool on macOS that allows you to schedule a task to be run at r ...
分类:系统相关   时间:2021-02-16 12:18:49    阅读次数:0
Matrix Chain Multiplication UVA - 442
Suppose you have to evaluate an expression like ABCDE where A,B,C,D and E are matrices. Since matrix multiplication is associative, the order in which ...
分类:其他好文   时间:2021-02-08 11:54:10    阅读次数:0
Hadoop+HBase+Spark+Hive环境搭建
本文对Hadoop+HBase+Spark+Hive环境搭建方法和步骤进行了详细介绍和说明,记录于此,供各位同学及自己参考研究。 ...
分类:其他好文   时间:2021-02-05 10:38:53    阅读次数:0
Spark环境配置
Spark环境配置 spark-env.sh #JAVA_HOME export JAVA_HOME=/export/servers/jdk1.8.0_271 #Spark Master Address #export SPARK_MASTER_HOME=node01 export SPARK_MA ...
分类:其他好文   时间:2021-02-04 11:53:09    阅读次数:0
Spark executor中task的数量与最大并发数
每个task处理一个partition,一个文件的大小/128M就是task的数量 Task的最大并发数 当task被提交到executor之后,会根据executor可用的cpu核数,决定一个executor中最多同时运行多少个task。 默认情况下一个task对应cpu的一个核。如果一个exec ...
分类:其他好文   时间:2021-02-02 11:14:58    阅读次数:0
微服务实践之分布式定时任务
承接上篇:上篇文章讲到改造 go-zero 生成的 app module 中的 gateway & RPC 。本篇讲讲如何接入 异步任务 以及 log的使用。 Delay Job 日常任务开放中,我们会有很多异步、批量、定时、延迟任务要处理,go-zero中有 go-queue,推荐使用 go-qu ...
分类:其他好文   时间:2021-02-02 10:46:15    阅读次数:0
11541条   上一页 1 ... 13 14 15 16 17 ... 1155 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!