码迷,mamicode.com
首页 >  
搜索关键字:spark streaming    ( 7556个结果
Spark中rdd分区数量的决定因素
1、参数配置(并行度)分区的默认个数等于对spark.default.parallelism的指定值2、根据父rdd的reduceTask数量3、读取hdfs的文件生成的rddrdd分区的数量等于hdfs的文件的block4、sparkStreaming生成的rdd根据block interval, ...
分类:其他好文   时间:2020-05-08 16:12:24    阅读次数:129
第二章:视图层 - 7:HttpResponse对象
类定义:class HttpResponse[source] HttpResponse类定义在django.http模块中。 HttpRequest对象由Django自动创建,而HttpResponse对象则由程序员手动创建. 我们编写的每个视图都要实例化、填充和返回一个HttpResponse对象 ...
分类:Web程序   时间:2020-05-06 10:22:00    阅读次数:79
oracle merge into在大数据离线批处理中的应用
前言 目前仅在一家公司做过大数据相关,也不太清楚其他公司情况。东家这常用的大数据离线处理基本就是sqoop导入到hive中,然后使用spark或者hive计算出结果再导出到oracle中。很多情况下是把oracle中整个表或者某个时间条件的筛选出来的数据整个删掉,再把最新的这部分数据全部导数回到or ...
分类:数据库   时间:2020-05-05 21:59:35    阅读次数:102
spark-xgboost8.1 java 例子
spark-xgboost8.1 java 例子
分类:编程语言   时间:2020-05-05 21:51:14    阅读次数:83
sparkcore sparksql单词统计—切分-聚合
1 package com.bawei.core 2 3 import org.apache.spark.rdd.RDD 4 import org.apache.spark.{SparkConf, SparkContext} 5 6 /** 7 * 单词统计 8 9 */ 10 object Spa ...
分类:数据库   时间:2020-05-05 18:27:44    阅读次数:87
Stream整合Flume
1 package com.bawei.stream 2 3 import java.net.InetSocketAddress 4 5 import org.apache.spark.storage.StorageLevel 6 import org.apache.spark.streaming. ...
分类:Web程序   时间:2020-05-05 18:21:50    阅读次数:79
Streaming的单词统计
1 package com.bawei.stream 2 3 import org.apache.spark.streaming.dstream.{DStream, ReceiverInputDStream} 4 import org.apache.spark.streaming.{Seconds, ...
分类:其他好文   时间:2020-05-05 18:01:51    阅读次数:55
四率一直_sparkcore
1 package com.bawei.review01 2 3 import org.apache.spark.rdd.RDD 4 import org.apache.spark.sql.{DataFrame, SparkSession} 5 6 case class StuScore(id:In ...
分类:其他好文   时间:2020-05-05 17:49:28    阅读次数:54
从Spark 的 log 文件看 job 执行过程
Spark Job log 文件分析: 下面是一个Spark 数据据统计Job 的 log 文件, 从前到后的顺序分析Job的执行过程(Spark local mode)。 启动 SparkContext 提交 Job RatingHistogram 20/05/04 18:02:20 INFO S ...
分类:其他好文   时间:2020-05-05 09:12:49    阅读次数:103
Spark搭建注意事项若干要点
一、关于UI地址 master: 8080 worker: 8081 application: 4040 (用来查看正在运行的app的情况, 一旦这个应用结束, 则无法查看) 二、历史服务器(这里说明yarn模式) 1、 配置历史服务器 1)spark-defaults.conf 默认配置 spar ...
分类:其他好文   时间:2020-05-05 00:33:46    阅读次数:60
7556条   上一页 1 ... 38 39 40 41 42 ... 756 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!