1.Spark SQL 基本操作 将下列 json 数据复制到你的 ubuntu 系统/usr/local/spark 下,并保存命名为 employee.json。 { "id":1 ,"name":" Ella","age":36 } { "id":2,"name":"Bob","age":29 ...
分类:
其他好文 时间:
2020-02-14 10:57:37
阅读次数:
50
环境如下: Hadoop 2.6.0以上 java JDK 1.7以上 Spark 3.0.0-preview2 一、Scala独立应用编程 二、java独立应用编程 1、安装maven ubuntu中没有自带安装maven,需要手动安装maven。可以访问maven官方下载自己下载。这里直接给出a ...
分类:
编程语言 时间:
2020-02-14 10:43:07
阅读次数:
103
实验 4 RDD 编程初级实践 一、实验目的 (1)熟悉 Spark 的 RDD 基本操作及键值对操作; (2)熟悉使用 RDD 编程解决实际具体问题的方法。 二、实验平台 操作系统:Ubuntu16.04 Spark 版本:2.1.0 三、实验内容和要求 1.spark-shell 交互式编程 下 ...
分类:
其他好文 时间:
2020-02-13 23:01:30
阅读次数:
143
第1章 课程介绍与学习指南本章中将向大家介绍课程能学到什么、解决什么实际问题、项目成果展示,课程整体安排以及如何学习更高效。第2章 开发环境与技术栈介绍本章主要针对课程中应用的开发环境以及技术栈进行相关介绍。本课中会使用,虚拟化技术: virtualbox + vagrant,容器化技术:docke ...
分类:
其他好文 时间:
2020-02-13 22:51:06
阅读次数:
806
环境如下: Hadoop 2.6.0以上 java JDK 1.7以上 Spark 3.0.0-preview2 一、Scala独立应用编程 1、安装sbt sbt是一款Spark用来对scala编写程序进行打包的工具,这里简单介绍sbt的安装过程,感兴趣的读者可以参考官网资料了解更多关于sbt的内 ...
分类:
其他好文 时间:
2020-02-13 22:31:48
阅读次数:
103
安装sbt sbt是一款Spark用来对scala编写程序进行打包的工具,下载地址https://repo.typesafe.com/typesafe/ivy-releases/org.scala-sbt/sbt-launch/0.13.11/sbt-launch.jar 下载后,执行如下命令拷贝至 ...
分类:
其他好文 时间:
2020-02-13 19:32:48
阅读次数:
73
一、大数据spark 跟着b站的尚硅谷大数据往后学习了8个知识点。 同时把scala的知识点学习了一下。 视频号: av62992342 av64039811 内容:Spark内核 课程学习进度:87/126 二、《一线架构师实践指南》阅读 阅读了第十四章 物理架构、运行架构、开发架构 ...
分类:
其他好文 时间:
2020-02-12 22:28:24
阅读次数:
64
spark的udf和udaf的注册 一、udf 二、udaf 1. 弱类型的自定义聚合函数 是不安全的 1. 强类型的自定义聚合函数 程序运行时候会检查数据的类型,是安全的 ...
分类:
其他好文 时间:
2020-02-12 22:10:58
阅读次数:
135
实验2-Scala编程初级实践-题目-厦门大学-林子雨-Spark编程基础(Scala版) 模拟图形绘制 对于一个图形绘制程序,用下面的层次对各种实体进行抽象。定义一个 Drawable 的特质,其包括一个 draw 方法,默认实现为输出对象的字符串表示。定义一个 Point 类表示点,其混入了 D ...
分类:
其他好文 时间:
2020-02-12 22:04:19
阅读次数:
62
1、任务中如何确定spark RDD分区数、task数目、core个数、worker节点个数、excutor数量 (1)hdfs 上的文件的存储形式是以 Block 的形式存储的,每个 File 文件都包含了很多块,一个Block默认是128M大小。当 spark 从 hdfs 上读取数据的时候,会 ...
分类:
其他好文 时间:
2020-02-12 16:16:22
阅读次数:
199