码迷,mamicode.com
首页 >  
搜索关键字:SPARK RDD    ( 7287个结果
Spark API编程动手实战-07-join操作深入实战
我们在hdfs的/data/join创建两个文件: 上传第一个文件名称为1.txt 内容第一列是日期,第二列uid(普通用户id) 上传第二个文件名称为2.txt 内容第一列是日期,第二列uid(普通用户id) 执行上传到hdfs: hdfs命令行查...
分类:Windows程序   时间:2015-02-05 15:14:08    阅读次数:198
Spark API编程动手实战-07-join操作深入实战
我们在hdfs的/data/join创建两个文件: 上传第一个文件名称为1.txt 内容第一列是日期,第二列uid(普通用户id) 上传第二个文件名称为2.txt 内容第一列是日期,第二列uid(普通用户id) 执行上传到hdfs: hdfs命令行查询: web控制台管理查询: 首先在命令行中设置日期格式: 然后声明...
分类:Windows程序   时间:2015-02-05 14:59:53    阅读次数:348
spark streaming 3: Receiver 到 submitJobSet
对于spark streaming来说,receiver是数据的源头。spark streaming的框架上,将receiver替换spark-core的以磁盘为数据源的做法,但是数据源(如监听某个tcp链接)显然不是可靠且不知道数据什么时候准备好的,所以spark streaming使用shuff...
分类:其他好文   时间:2015-02-05 14:58:43    阅读次数:184
spark streaming 2: DStream
DStream是类似于RDD概念,是对数据的抽象封装。它是一序列的RDD,事实上,它大部分的操作都是对RDD支持的操作的封装,不同的是,每次DStream都要遍历它内部所有的RDD执行这些操作。它可以由StreamingContext通过流数据产生或者其他DStream使用map方法产生(与RDD一...
分类:其他好文   时间:2015-02-05 14:56:02    阅读次数:260
spark streaming 1: SparkContex
StreamingContext 和SparkContex的用途是差不多的,作为spark stream的入口,提供配置、生成DStream等功能。总体来看,spark stream包括如下模块:/** * Main entry point for Spark Streaming functiona...
分类:其他好文   时间:2015-02-05 14:54:10    阅读次数:293
spark streaming 4: DStreamGraph JobScheduler
DStreamGraph有点像简洁版的DAG scheduler,负责根据某个时间间隔生成一序列JobSet,以及按照依赖关系序列化。这个类的inputStream和outputStream是最重要的属性。spark stream将动态的输入流与对流的处理通过一个shuffle来连接。前面的(shu...
分类:其他好文   时间:2015-02-05 14:53:13    阅读次数:302
一天一段scala代码(六)
一天一段scala代码(六)        为了更好的驾驭spark,最近在学习scala语言特性,主要看《快学scala》,顺便把一些自己认为有用的代码记下来。 package examples class Account { val id = Account.getUnique()//访问这个类的伴生对象 } object Account //上面类...
分类:其他好文   时间:2015-02-04 21:52:08    阅读次数:254
centos修改主机名整理(勿喷)
1.临时修改主机名 显示主机名: spark@master:~$ hostname master 修改主机名: spark@master:~$ sudo hostname hadoop spark@master :~$ hostname hadoop PS:以上的修改只是临时修改,重启后就恢复原样了。 2.永...
分类:其他好文   时间:2015-02-04 20:30:10    阅读次数:484
Spark API编程动手实战-06-对搜狗日志文件深入实战操作
本节中所用到的内容是来自搜狗实验室,网址为:http://www.sogou.com/labs/dl/q.html 我们使用的是迷你版本的tar.gz格式的文件,其大小为87K,下载后如下所示: 上传到服务器后,解压并查看: 查看Sogou文件内容:...
分类:Windows程序   时间:2015-02-04 13:10:35    阅读次数:181
关于spring获取webApplication.getBean多种途径和简单解释
ApplicationContext ac1 = new FileSystemXmlApplicationContext("com/spark/system/applicationContext.xml");//如果配置文件放在文件系统的目录下则优先使用该方式 //com/spark/system/applicationContext.xml等价于"file:com/spark/system/a...
分类:移动开发   时间:2015-02-04 13:04:21    阅读次数:227
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!