码迷,mamicode.com
首页 >  
搜索关键字:spark rdd    ( 7287个结果
5.Spark 快速起步
Quick Start Security Interactive Analysis with the Spark Shell Basics More on Dataset Operations Caching Self-Contained Applications Where to Go from ...
分类:其他好文   时间:2020-02-22 13:54:19    阅读次数:106
4. Spark 提交应用
Spark 提交应用 Spark’s bin 目录的spark-submit 脚本用于在一个集群上启动应用。它能通过统一的接口使用所有Spark支持的集群管理器。你不必为每个特别配置你的应用。 统一语法如下: ./bin/spark-submit \ --class <main-class> \ - ...
分类:其他好文   时间:2020-02-22 13:53:33    阅读次数:73
Spark on Kubernetes与阿里云的深度整合
将Spark on Kubernetes与阿里云深度整合,设计一个开箱即用的Spark on Kubernetes镜像。 ...
分类:Web程序   时间:2020-02-22 13:53:07    阅读次数:74
Spark RDD基本概念、宽窄依赖、转换行为操作
本文介绍一下rdd的基本属性概念、rdd的转换/行动操作、rdd的宽/窄依赖。 ...
分类:其他好文   时间:2020-02-22 13:40:00    阅读次数:67
1. Spark 概念
Apache Spark: http://spark.apache.org/ ...
分类:其他好文   时间:2020-02-22 12:08:37    阅读次数:48
spark集群
https://blog.csdn.net/boling_cavalry/article/details/86747258 https://www.cnblogs.com/xuliangxing/p/7234014.html 第二个链接较为详细,但版本较旧 注意spark 7077端口URL,如果h ...
分类:其他好文   时间:2020-02-22 09:20:09    阅读次数:75
小记--------spark ——AGScheduler源码分析
DAGScheduler类位置:org.apache.spark.scheduler //DAGScheduler调度的核心入口 1 private[scheduler] def handleJobSubmitted(jobId: Int, 2 finalRDD: RDD[_], 3 func: ( ...
分类:其他好文   时间:2020-02-22 00:19:46    阅读次数:64
HDFS架构
学习一个新框架方法: 推荐:官网+源码 跪在坚持 hadoop.apache.org spark.apache.org flink.apache.org storm.apache.org Hadoop:由HDFS/YARN/Map Reduce构成 HDFS 一个NameNode 和多个DATa N ...
分类:其他好文   时间:2020-02-21 18:19:23    阅读次数:55
大数据引擎分代
大致可以将大数据的计算引擎分成了 4 代。 1、第一代的计算引擎,无疑就是Hadoop承载的MapReduce。它将每个JobApp都被设计为两个阶段,分别为Map和Reduce。对于上层应用来说,就不得不想方设法去拆分算法,甚至于不得不在 上层应用实现多个App的串联 ,才能完成一个完整的算法,例 ...
分类:其他好文   时间:2020-02-21 12:50:43    阅读次数:77
(数据挖掘)大数据Flume+kafka+zookeeper+Strom/Spark/Fink......
图中黑点代表求婚注册者.假如是一个程序员 ...
分类:Web程序   时间:2020-02-21 09:55:14    阅读次数:71
7287条   上一页 1 ... 54 55 56 57 58 ... 729 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!