码迷,mamicode.com
首页 >  
搜索关键字:hive on spark    ( 12366个结果
Spark 1.0.1源码安装
apache 网站上面已经有了已经构建好了的版本,我这里还是自己利用午休时间重新构建一下(jdk,python,scala的安装就省略了,自己可以去安装) http://www.apache.org/dist/spark/spark-1.0.1/ 具体官网的下载链接可...
分类:其他好文   时间:2014-07-23 17:40:11    阅读次数:273
鸡肋的JdbcRDD
今天准备将mysql的数据倒腾到RDD,很早以前就知道有一个JdbcRDD,就想着使用一下,结果发现却是鸡肋一个。       首先,看看JdbcRDD的定义: * An RDD that executes an SQL query on a JDBC connection and reads results. * For usage example, see test case ...
分类:数据库   时间:2014-07-23 16:36:21    阅读次数:408
Hive与Hbase区别
hive是什么? 白话一点再加不严格一点,hive可以认为是map-reduce的一个包装。hive的意义就是把好写的hive的sql转换为复杂难写的map-reduce程序。 于是,hbase是什么? 同样白话一点加不严格一点,hbase可以认为是...
分类:其他好文   时间:2014-07-23 13:57:36    阅读次数:268
Spark Core源代码分析: Spark任务模型
概述一个Spark的Job分为多个stage,最后一个stage会包含一个或多个ResultTask,前面的stages会包含一个或多个ShuffleMapTasks。ResultTask运行并将结果返回给driver application。ShuffleMapTask将task的output依据...
分类:其他好文   时间:2014-07-23 12:43:36    阅读次数:376
“大数据讲师”、“Hadoop讲师”、“Spark讲师”、“云计算讲师”、“Android讲师”
王家林简介Spark亚太研究院院长和首席专家,中国目前唯一的移动互联网和云计算大数据集大成者。在Spark、Hadoop、Android等方面有丰富的源码、实务和性能优化经验。彻底研究了Spark从0.5.0到0.9.1共13个版本的Spark源码,并已完成2014年5月31日发布的Spark1.0...
分类:移动开发   时间:2014-07-22 23:29:47    阅读次数:241
夏梦竹谈Hive vs. HBase的区别
对于刚接触大数据的用户来说,要想区分Hive与HBase是有一定难度的。本文将尝试从其各自的定义、特点、限制、应用场景等角度来进行分析,以作抛砖引玉之用。Hive是什么?Apache Hive是一个构建于Hadoop(分布式系统基础架构)顶层的数据仓库,注意这里不是数据库。Hive可以看作是用户编程...
分类:其他好文   时间:2014-07-22 22:45:54    阅读次数:257
hive 使用
参考资料1.QuickStarthttps://cwiki.apache.org/confluence/display/Hive/GettingStarted2.Tutorialhttps://cwiki.apache.org/confluence/display/Hive/Tutorial3.官方...
分类:其他好文   时间:2014-07-22 22:44:14    阅读次数:249
Spark-Dependency
1、Spark中采用依赖关系(Dependency)表示rdd之间的生成关系。Spark可利用Dependency计算出失效的RDD。在每个RDD中都存在一个依赖关系的列表 private var dependencies_ : Seq[Dependency[_]] = null 用以记录各rdd中各partition的parent partition。 2、Spark中存在两类Depe...
分类:其他好文   时间:2014-07-22 22:34:15    阅读次数:264
hive SQL优化之distribute by和sort by
最近在优化hiveSQL, 下面是一段排序,分组后取每组第一行记录的SQL INSERT OVERWRITE TABLE t_wa_funnel_distinct_temp PARTITION (pt='${SRCTIME}')  SELECT      bussiness_id,      cookie_id,      session_id,      funnel_...
分类:数据库   时间:2014-07-22 17:42:31    阅读次数:344
Spark SQL Catalyst源码分析之Analyzer
本文详细介绍了Spark SQL的Catalyst里,Analyzer是如何Sql parser的解析的UnResolved逻辑计划,进行resolve的。...
分类:数据库   时间:2014-07-22 14:49:52    阅读次数:396
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!