搜索关键字：spark executor worker，搜索到10463个结果！码迷,mamicode.com！

Spark实战(三)本地连接远程Spark(Python环境)

一、Python环境准备远程服务器上Python版本要与本地想匹配，这里本地使用Anaconda来进行安装，远程服务器之间安装。 wget --no-check-certificate https://www.python.org/ftp/python/3.6.7/Python-3.6.7.tgz ...

分类：编程语言时间：2021-01-25 11:30:39 阅读次数：0

Spark面试常见问题(一)--RDD基础

1 RDD基础知识 1.1 Spark的RDD五大特性 1.1.1 A list of partitions RDD是一个由多个partition（某个节点里的某一片连续的数据）组成的的List；将数据加载为RDD时，一般一个hdfs里的block会加载为一个partition。对于RDD来说，每 ...

分类：其他好文时间：2021-01-25 11:30:09 阅读次数：0

celery+django的定时任务设置 - 最佳实践 - 在django管理后台配置定时任务

1.快速测试和监控，启动多个celery worker，-A 指定项目目录， -P 指定方式，我这里以协程方式运行， -n指定name celery worker -A voice_quality_assurance_configure --loglevel=info -P eventlet -n ...

分类：其他好文时间：2021-01-25 10:45:57 阅读次数：0

Trino总结

文章目录 1.Trino与Spark SQL的区别分析 2.Trino与Spark SQL解析过程对比 3.Trino基本概念 4.Trino架构 5.Trino SQL执行流程 6.Trino Task执行流程相关参考： 1.Trino与Spark SQL的区别分析 2.Trino与Spark ...

分类：其他好文时间：2021-01-22 12:05:01 阅读次数：0

spark2.2 + jdk1.8 + centos7集群安装教程（单个Master，不依赖hadoop安装）

1.准备环境安装centos7，在此我准备了五个虚拟机，分别命名为L1，L2,L3,L4,L5.计划在L1上面运行Master节点，在L3,L4,L5上面运行Worker节点。网络配置以及ssh免密登陆配置不再详细讲解，请参考我的另外一篇博客：虚拟机网络配置以及准备工作：https://blog. ...

分类：其他好文时间：2021-01-22 11:44:51 阅读次数：0

Hive整合Hbase

HBase 虽然可以存储数亿或数十亿行数据，但是对于数据分析来说，不太友好，只提供了简单的基于 Key 值的快速查询能力，没法进行大量的条件查询。现有hbase的查询工具有很多如：Hive，Tez，Impala，Shark/Spark，Phoenix等。今天主要说Hive，Hive方便地提供了Hiv ...

分类：其他好文时间：2021-01-21 10:54:30 阅读次数：0

使用MessageChannel(消息通道)进行深拷贝

深拷贝一般用JSON.parse(JSON.stringify(object))就可以解决了，也知道这种方法的局限性：会忽略 undefined 不能序列化函数不能解决循环引用的对象因为MessageChannel的postMessage传递的数据也是深拷贝的，这和web worker的po ...

分类：其他好文时间：2021-01-19 12:10:47 阅读次数：0

Spark学习--Structured Streaming

Structured Streaming Structured Streaming 是 Spark Streaming 的进化版 Spark 编程模型的进化过程总结 RDD 的优点面向对象的操作方式可以处理任何类型的数据 RDD 的缺点运行速度比较慢, 执行过程没有优化 API 比较僵硬, ...

分类：其他好文时间：2021-01-18 11:40:47 阅读次数：0

pyspark dataframe save into hive

# 先定义dataframe各列的数据类型 from pyspark.sql.types import *schema = StructType([ StructField("a", NullType(), True), StructField("b", AtomicType(), True), S ...

分类：其他好文时间：2021-01-18 11:29:36 阅读次数：0

spark学习进度25（SparkCore实战案例）

词频统计：要求：统计Harry Potter.txt文件中出现最多单词前十位内容样例：代码及结果： @Test//词频统计 def WordCount(): Unit ={ val conf=new SparkConf().setMaster("local[6]").setAppName("w ...

分类：其他好文时间：2021-01-18 11:17:13 阅读次数：0

共10463条上一页 1 ... 16 17 18 19 20 ... 1047 下一页

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)