搜索关键字：spark 1.0.0，搜索到7001个结果！码迷,mamicode.com！

每日一题为了工作 2020 0508 第六十六题

package spark.action.factory; import org.apache.spark.api.java.JavaRDD; import org.apache.spark.api.java.JavaSparkContext; import org.apache.spark.sql ...

分类：其他好文时间：2020-05-08 21:18:36 阅读次数：120

spark常用操作(二)

//spark读取数据 Dataset<Row> df = spark.read().textFile(currentSrcPath, 1); Dataset<Row> df = spark.read().json(path); Dataset<Row> df = spark.read().orc( ...

分类：其他好文时间：2020-05-08 18:23:41 阅读次数：85

Spark中rdd分区数量的决定因素

1、参数配置(并行度)分区的默认个数等于对spark.default.parallelism的指定值2、根据父rdd的reduceTask数量3、读取hdfs的文件生成的rddrdd分区的数量等于hdfs的文件的block4、sparkStreaming生成的rdd根据block interval， ...

分类：其他好文时间：2020-05-08 16:12:24 阅读次数：129

oracle merge into在大数据离线批处理中的应用

前言目前仅在一家公司做过大数据相关，也不太清楚其他公司情况。东家这常用的大数据离线处理基本就是sqoop导入到hive中，然后使用spark或者hive计算出结果再导出到oracle中。很多情况下是把oracle中整个表或者某个时间条件的筛选出来的数据整个删掉，再把最新的这部分数据全部导数回到or ...

分类：数据库时间：2020-05-05 21:59:35 阅读次数：102

spark-xgboost8.1 java 例子

分类：编程语言时间：2020-05-05 21:51:14 阅读次数：83

sparkcore sparksql单词统计—切分-聚合

1 package com.bawei.core 2 3 import org.apache.spark.rdd.RDD 4 import org.apache.spark.{SparkConf, SparkContext} 5 6 /** 7 * 单词统计 8 9 */ 10 object Spa ...

分类：数据库时间：2020-05-05 18:27:44 阅读次数：87

Stream整合Flume

1 package com.bawei.stream 2 3 import java.net.InetSocketAddress 4 5 import org.apache.spark.storage.StorageLevel 6 import org.apache.spark.streaming. ...

分类：Web程序时间：2020-05-05 18:21:50 阅读次数：79

Streaming的单词统计

1 package com.bawei.stream 2 3 import org.apache.spark.streaming.dstream.{DStream, ReceiverInputDStream} 4 import org.apache.spark.streaming.{Seconds, ...

分类：其他好文时间：2020-05-05 18:01:51 阅读次数：55

四率一直_sparkcore

1 package com.bawei.review01 2 3 import org.apache.spark.rdd.RDD 4 import org.apache.spark.sql.{DataFrame, SparkSession} 5 6 case class StuScore(id:In ...

分类：其他好文时间：2020-05-05 17:49:28 阅读次数：54

从Spark 的 log 文件看 job 执行过程

Spark Job log 文件分析：下面是一个Spark 数据据统计Job 的 log 文件，从前到后的顺序分析Job的执行过程（Spark local mode）。启动 SparkContext 提交 Job RatingHistogram 20/05/04 18:02:20 INFO S ...

分类：其他好文时间：2020-05-05 09:12:49 阅读次数：103

共7001条上一页 1 ... 35 36 37 38 39 ... 701 下一页

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)