码迷,mamicode.com
首页 >  
搜索关键字:spark 1.0.0    ( 7001个结果
寒假自学进度3
Spark运行基本流程 (1)当一个 Spark Application 被提交时,首先需要为这个应用构建起基本的运行环境, 即由 Driver 创建一个 SparkContext进行资源的申请、任务的分配和监控。 SparkContext 会向资源管理器注册并申 请运行 Executor 的资源; ...
分类:其他好文   时间:2020-02-01 19:30:14    阅读次数:62
spark生态体系了解学习(三)
今天往虚拟机上安装了Scala和spark,下面说一下安装的一些过程和遇到的一些问题。 首先,根据网上的Hadoop3.2+Scala2.12.1+Spark2.3.3环境搭建教程:https://www.jianshu.com/p/82ad3e15545a 了解基本安装流程,由于之前已经安装好了v ...
分类:其他好文   时间:2020-02-01 19:29:59    阅读次数:59
spark基本面试题
[Toc] 一、spark基本常识 1、spark中的RDD是什么,有哪些特性? RDD(Resilient Distributed Dataset)叫做分布式数据集模式spark中最基本的数据抽象,它代表一个不可变,可分区,里面的元素可以并行计算的集合。 Resilient:表示弹性的,弹性表示 ...
分类:其他好文   时间:2020-02-01 16:09:42    阅读次数:85
Apache Hudi 0.5.1版本重磅发布
历经大约3个月时间,Apache Hudi 社区终于发布了0.5.1版本,这是Apache Hudi发布的第二个Apache版本,该版本中一些关键点如下 版本升级 将Spark版本从2.1.0升级到2.4.4 将Avro版本从1.7.7升级到1.8.2 将Parquet版本从1.8.1升级到1.10 ...
分类:Web程序   时间:2020-02-01 10:31:42    阅读次数:386
大三寒假生活4
感觉今天也没整出什么大的进展,在学习eclipse编写spark程序过程中,虚拟机中因为eclipse版本号的问题安装不上spark和scala插件,鼓捣了半天也没有进展,在虚拟机中下载对应的版本因为网速过于慢最终也放弃了。最终从windows中下载了对应的eclipse版本,通过ftp传到了虚拟机 ...
分类:其他好文   时间:2020-01-31 22:25:14    阅读次数:88
寒假自学进度报告1
今天我主要了解了spark的一些专业名词以及相关特点: spark简介: 最初由美国加州伯克利大学的AMP实验室于2009年开发,是基于内存计算的大数据计算框架,可用于构建大型,低延迟的数据分析应用程序 2014年打破了hadoop保持的基准排序记录 Spark具有以下特点: 运行速度快:使用DAG ...
分类:其他好文   时间:2020-01-31 20:45:10    阅读次数:107
spark实验(一)--linux系统常见命令及其文件互传(2)
2.使用 Linux 系统的常用命令 启动 Linux 虚拟机,进入 Linux 系统,通过查阅相关 Linux 书籍和网络资料,或者参考 本教程官网的“实验指南”的“Linux 系统常用命令”,完成如下操作: (1)切换到目录 /usr/bin; 输入cd /usr/bin (2)查看目录/usr ...
分类:系统相关   时间:2020-01-31 20:32:26    阅读次数:164
spark图操作
spark graphx图操作 import org.apache.spark.graphx.{Edge, Graph, VertexId} import org.apache.spark.rdd.RDD import org.apache.spark.{SparkConf, SparkContex ...
分类:其他好文   时间:2020-01-31 18:51:08    阅读次数:65
Spark学习10_1 sparkMllib入门与相关资料索引
[TOC] 资料 "Spark机器学习库(MLlib)中文指南" "关于spark机器学习的知乎专栏" "Spark入门实战系列 8.Spark MLlib(上) 机器学习及SparkMLlib简介" "基本Kmeans算法介绍及其实现" [spark MLlib 概念 1:相关系数( PPMCC ...
分类:其他好文   时间:2020-01-31 13:59:26    阅读次数:104
2020年寒假学习进度第二天
今天主要研究了spark实验二的第一部分的Scala编写,看完代码后发现需要在REPL模式下运行,经过查证发现需要安装scala脚本,所以尝试在虚拟机中安装scala,成功后使用给的代码尝试运行,但是出错,提示没有找到类的定义,经过查证,发现是代码中缺少类得定义。改正后可以正常运行。 import ...
分类:其他好文   时间:2020-01-31 12:48:11    阅读次数:93
7001条   上一页 1 ... 62 63 64 65 66 ... 701 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!