昨天看个帖子微软市值超过1万亿美刀,凭什么?我们可以找出很多理由,但是我认为和阿三CEO的开源战略关系很大。从开源.net到WSL到微软云微软从昔日的开源死敌,到今天的怀抱开源。日前在Spark + AI峰会上,微软发布了开源的.NET for Apache Spark,从而在大数据领域又添加了一枝 ...
分类:
Web程序 时间:
2020-02-18 09:15:05
阅读次数:
238
spark运行模式 下面我们来看一下spark的运行模式,根据上一篇博客我们知道spark的运行模式分为以下几种:local、standalone、hadoop yarn。我们说本地开发最好用local模式,直接搭建一个spark环境就可以跑了,因为测试的话本地是最方便的。standalone,用的 ...
分类:
其他好文 时间:
2020-02-17 18:05:26
阅读次数:
86
sparkUi的4040界面已经有了运行监控指标,为什么我们还要自定义存入redis? 1.结合自己的业务,可以将监控页面集成到自己的数据平台内,方便问题查找,邮件告警 2.可以在sparkUi的基础上,添加一些自己想要指标统计 一、spark的SparkListenersparkListener是 ...
分类:
其他好文 时间:
2020-02-17 01:03:57
阅读次数:
306
spark核心之RDD 什么是RDD RDD指的是弹性分布式数据集 ,它是spark计算的核心。尽管后面我们会使用DataFrame、Dataset进行编程,但是它们的底层依旧是依赖于RDD的。我们来解释一下RDD 的这几个单词含义。 + + + RDD是spark的一个最基本的抽象 ,它代表了不可 ...
分类:
其他好文 时间:
2020-02-17 00:57:46
阅读次数:
125
import org.apache.spark.{SparkConf, SparkContext} import scala.util.parsing.json.JSON object JSONParse { def main(args: Array[String]): Unit = { val i ...
分类:
Web程序 时间:
2020-02-17 00:45:38
阅读次数:
120
默认是INFO级别,输出内容太多,影响真正输出结果的查找,需要修改成 WARN 或 ERROR 级别 1 spark根目录conf/log4j.properties.template拷贝到工程的resources目录下,并改名成 log4j.properties 2 修改log4j.properti ...
分类:
其他好文 时间:
2020-02-17 00:38:28
阅读次数:
80
1.Spark SQL 基本操作将下列 JSON 格式数据复制到 Linux 系统中,并保存命名为 employee.json。 { "id":1 , "name":" Ella" , "age":36 }{ "id":2, "name":"Bob","age":29 }{ "id":3 , "na ...
分类:
数据库 时间:
2020-02-16 11:31:05
阅读次数:
164
package com.hollysys.spark import java.util import org.apache.spark.sql.types._ import org.apache.spark.sql.{Row, SQLContext, SparkSession} /** * Crea ...
分类:
其他好文 时间:
2020-02-16 00:54:58
阅读次数:
125
一、大数据spark 补写实验报告 学习 python 二、《一线架构师实践指南》阅读 阅读了最后一章 ...
分类:
其他好文 时间:
2020-02-15 23:20:51
阅读次数:
77
实验5-Spark SQL编程初级实践-题目-厦门大学-林子雨-Spark编程基础(Scala版) 1.Spark SQL 基本操作将下列 JSON 格式数据复制到 Linux 系统中,并保存命名为 employee.json。 { "id":1 , "name":" Ella" , "age":3 ...
分类:
其他好文 时间:
2020-02-15 20:27:52
阅读次数:
119