搜索关键字：spark history，搜索到9960个结果！码迷,mamicode.com！

The history of Graph Store(matrix, adjacency list, and orthogonal list)

在图论中涉及到了图存储相关的方案，但它们是怎么来的？按照自己的理解，尝试着分析了关于图存储的发展史。不一定完全正确，仅供参考。...

分类：其他好文时间：2014-08-03 12:47:45 阅读次数：246

bash的特性（1）常用组合快捷键：，ctrl+dCtrl+a:跳转至命令行首Ctrl+e:跳转至命令行尾Ctrl+u:删除命令行首至当前光标所在处之前的所有内容Ctrl+k:删除当前光标所在处至命令行尾的所有内容Ctrl+l:清屏Ctrl+c:中止或取消Ctrl+z:把当命令送至后台Ctrl+d:回到登陆用户登陆界面（2..

分类：系统相关时间：2014-08-03 07:55:45 阅读次数：409

Apache Spark技术实战之1 -- KafkaWordCount

Spark应用开发实践性非常强，很多时候可能都会将时间花费在环境的搭建和运行上，如果有一个比较好的指导将会大大的缩短应用开发流程。本篇主要讲述如何运行KafkaWordCount，这个需要涉及Kafka集群的搭建，还是说越仔细越好。

分类：其他好文时间：2014-08-02 23:13:04 阅读次数：267

从Storm和Spark Streaming学习流式实时分布式计算系统的设计要点

最近我在做流式实时分布式计算系统的架构设计，而正好又要参见CSDN博文大赛的决赛。本来想就写Spark源码分析的文章吧。但是又想毕竟是决赛，要拿出一些自己的干货出来，仅仅是源码分析貌似分量不够。因此，我将最近一直在做的系统架构的思路整理出来，形成此文。为什么要参考Storm和Spark，因为没有参照效果可能不会太好，尤其是对于Storm和Spark由了解的同学来说，可能通过对比，更能体会到每个具体实现背后的意义。本文对流式系统出现的背景，特点，数据HA，服务HA，节点间和计算逻辑间的消息传递，存储模型，...

分类：其他好文时间：2014-08-02 18:25:23 阅读次数：489

大数据分析技术

大数据分析技术MR ：离线计算框架Storm ：实时计算框架Spark ：内存计算框架YARN 基本架构ResourceManager? 处理客户端请求? 启动/ 监控ApplicationMaster? 监控NodeManager? 资源分配与调度NodeManager? 单个节点上的资源管理? ...

分类：其他好文时间：2014-08-02 09:57:33 阅读次数：285

Spark分析之Job Scheduling Process

经过前面文章的SparkContext、DAGScheduler、TaskScheduler分析，再从总体上了解Spark Job的调度流程1、SparkContext将job的RDD DAG图提交给DAGScheduler；2、DAGScheduler将job分解成Stage DAG，将每个Sta...

分类：其他好文时间：2014-08-02 04:07:42 阅读次数：1266

VMware 克隆虚拟机或加载新的已安装虚拟机时System eth0不能使用的解决方法

近年来的大数据应用特别热，特别是Hadoop和Spark。但大家使用这些分布式文件系统和计算框架都需要一个分布式的集群环境，而大家手头一般没有多余的机器部署master和多个slave节点，就只能在VMware上多安装几个虚拟机来模拟集群的搭建，但是安装好一台虚拟机后，我想大部分的人都不想再耗时再重...

分类：其他好文时间：2014-08-02 01:49:52 阅读次数：267

Spark数据本地性

1、文件系统本地性第一次运行时数据不在内存中，需要从HDFS上取，任务最好运行在数据所在的节点上；2、内存本地性第二次运行，数据已经在内存中，所有任务最好运行在该数据所在内存的节点上；3、LRU置换如果数据只缓存在内存中而并没有缓存到磁盘上，此时数据被置换出内存，则从HDFS上读取； ...

分类：其他好文时间：2014-08-02 01:47:22 阅读次数：218

Spark运行架构

1、构建Spark Application运行环境；在Driver Program中新建SparkContext（包含sparkcontext的程序称为Driver Program）；Spark Application运行的表现方式为：在集群上运行着一组独立的executor进程，这些进程由spar...

分类：其他好文时间：2014-08-02 01:34:22 阅读次数：292

GraphX笔记

val graph=GraphLoader.edgeListFile(sc,"/home/spark/spark/graphx/data/followers.txt")//加载边时顶点是边上出现的点,定点默认数据是1 val users = sc.textFile("/home/spark/spark/graphx/data/users.txt").map { line=> val field...

分类：其他好文时间：2014-08-01 23:17:12 阅读次数：323

共9960条上一页 1 ... 968 969 970 971 972 ... 996 下一页

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)