在过去,每个应用都是单个程序,跑在单一CPU的单一服务器上。现在不一样了。在大数据和云计算的世界里,应用都是由许多独立的程序运行在一组不断变化的机器上。 协调这些独立程序的行为比起单一程序来困难的多。这样很容易导致开发人员陷入协调的逻辑而没有时间来实现正确的应用逻辑,或者反过来,花很少的时...
分类:
其他好文 时间:
2014-07-16 21:20:54
阅读次数:
149
spark-submit \--name SparkSubmit_Demo \--class com.luogankun.spark.WordCount \--master yarn-client \--executor-memory 1G \--total-executor-cores 1 \/h...
分类:
其他好文 时间:
2014-07-16 21:09:32
阅读次数:
260
spark jdbc分支源码下载地址 https://github.com/apache/spark/tree/branch-1.0-jdbc编译spark jdbc ./make-distribution.sh --hadoop 2.3.0-cdh5.0.0 --with-yarn --wit.....
分类:
数据库 时间:
2014-07-16 21:04:35
阅读次数:
306
在Mysql数据库中,Mysql Merge表有点类似于视图。下面就让我们来一起了解一下Mysql Merge表都有哪些优点,希望对您能有所帮助。
Mysql Merge表的优点:
A: 分离静态的和动态的数据
B:利用结构接近的的数据来优化查询
C: 查询时可以访问更少的数据
D:更容易维护大数据集
E: 可以通过修改.mrg文件来修改Merge表,当然也可以用alter进行修改...
分类:
数据库 时间:
2014-07-10 23:53:04
阅读次数:
313
在spark-shell中可以定制成接近shark的操作,让熟悉sql的人轻松上手。...
分类:
其他好文 时间:
2014-07-10 23:08:16
阅读次数:
210
http://ns.adobe.com/mxml/2009"
xmlns:s="library://ns.adobe.com/flex/spark"
xmlns:mx="library://ns.adobe.com/flex/mx" xmlns:supportClasses="com.esri.ags.skins.supportClasses.*" minWidth...
Spark1.1发布后会支持Spark SQL CLI , Spark SQL的CLI会要求被连接到一个Hive Thrift Server上,来实现类似hive shell的功能。...
分类:
数据库 时间:
2014-07-10 21:14:38
阅读次数:
737
概述
最近工作上忙死了……广播变量这一块其实早就看过了,一直没有贴出来。
本文基于Spark 1.0源码分析,主要探讨广播变量的初始化、创建、读取以及清除。
类关系
BroadcastManager类中包含一个BroadcastFactory对象的引用。大部分操作通过调用BroadcastFactory中的方法来实现。
BroadcastFactory是一个Trait,有两个直接子...
分类:
其他好文 时间:
2014-07-10 19:43:49
阅读次数:
298
1.使用命令行操作1)4个通用命令行<1>archive归档文件的创建用途:由于hadoop的设计是为了处理大数据,理想的数据应该blocksize的倍数。namenode在启动时会将所有的元数据load到内存中当大量小于blocksize的文件存在的时候,,不仅占用了大量的存储空间,也占用了大量的n..
分类:
其他好文 时间:
2014-07-10 18:56:21
阅读次数:
353
本文介绍了spark对hadoop sequencefile的读写支持,实现方式以及简单的使用方法。sequencefile和textfile类似,在上下文里有直接提供读取方法,但最终走的还是hadoopFile方法。...
分类:
其他好文 时间:
2014-07-10 17:11:52
阅读次数:
951