码迷,mamicode.com
首页 >  
搜索关键字:spark-submit    ( 132个结果
关于IDEA开发环境下的Kafka+Spark Streaming的classpath配置方式
一、前言<!--more--> 在使用Spark Streaming中的Kafka Direct API进行Kafka消费的过程中,通过spark-submit的方式提交jar包,会出现如下错误信息,提示无法找到KafkaUtils。 Exceptionin thread "main" java.l ...
分类:其他好文   时间:2017-03-08 23:04:59    阅读次数:379
spark-submit 提交任务
将工程打成jar 放入到linux中 切换到[root@node4 Desktop]# cd /usr/local/development/spark-2.0-hadoop2.6/bin/ 输入命令 打印出结果 ...
分类:其他好文   时间:2017-03-06 23:29:45    阅读次数:209
sparkR原理
sparkR在spark2.0里面,RDD后端代码位于org.apache.spark.rdd中,R语言相关的位于org.apache.spark.api.r中。 从入口开始,./bin/sparkR里面只有四句话,调用的是这个 spark-submit里面是个一句话的shell脚本 好了,入口是o ...
分类:其他好文   时间:2017-03-02 16:30:12    阅读次数:209
spark性能调优01-常规调优
1、分配更多的资源 1.1 分配的资源有:executor、cup per executor、memory per executor、driver memory 1.2 如何分配:在spark-submit提交时设置相应的参数 1.3 调节到多大(原则:能使用的资源有多大,就尽量调节到最大的大小) ...
分类:其他好文   时间:2017-02-23 15:49:45    阅读次数:356
Spark 应用程序部署工具spark-submit
1. 简介Spark的bin目录中的spark-submit脚本用于启动集群上的应用程序。 可以通过统一的接口使用Spark所有支持的集群管理器,因此不必为每个集群管理器专门配置你的应用程序(It c...
分类:其他好文   时间:2017-02-17 10:24:31    阅读次数:274
通过 --py-files 可以在pyspark中可以顺利导入
文件import问题 问题: 在脚本中import了其他文件, pyspark中可以运行, 但是在spark-submit中总是失败 假定我们的任务脚本为 app.py , 大体代码像这样: from pyspark import SparkContext ## 加载通用脚本 import comm ...
分类:其他好文   时间:2016-12-17 13:35:56    阅读次数:1708
Spark on Yarn:任务提交参数配置
当在YARN上运行Spark作业,每个Spark executor作为一个YARN容器运行。Spark可以使得多个Tasks在同一个容器里面运行。 以下参数配置为例子: spark-submit --master yarn-cluster #使用集群调度模式(一般使用这个参数) --num-exec ...
分类:其他好文   时间:2016-12-09 08:38:44    阅读次数:305
sparkR原理
sparkR在spark2.0里面,RDD后端代码位于org.apache.spark.rdd中,R语言相关的位于org.apache.spark.api.r中。 从入口开始,./bin/sparkR里面只有四句话,调用的是这个 spark-submit里面是个一句话的shell脚本 好了,入口是o ...
分类:其他好文   时间:2016-11-28 15:45:54    阅读次数:245
谈hadoop/spark里为什么都有,YARN呢?
在Hadoop集群里,有三种模式: 1、本地模式 2、伪分布模式 3、全分布模式 在Spark集群里,有四种模式: 1、local单机模式 结果xshell可见: ./bin/spark-submit --class org.apache.spark.examples.SparkPi --maste ...
分类:其他好文   时间:2016-11-23 10:10:39    阅读次数:335
Spark submit依赖包管理!
Sparksubmit依赖包管理!使用spark-submit时,应用程序的jar包以及通过—jars选项包含的任意jar文件都会被自动传到集群中。spark-submit--class--master--jarsSpark使用了下面的URL格式允许不同的jar包分发策略。1、文件file方式:绝对路径且file:/URIs是作为driver的HTTP文件服..
分类:其他好文   时间:2016-11-15 01:46:08    阅读次数:169
132条   上一页 1 ... 7 8 9 10 11 ... 14 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!