搜索关键字：hive on spark，搜索到12366个结果！码迷,mamicode.com！

Spark 1.0.1源码安装

apache 网站上面已经有了已经构建好了的版本，我这里还是自己利用午休时间重新构建一下（jdk,python,scala的安装就省略了，自己可以去安装） http://www.apache.org/dist/spark/spark-1.0.1/ 具体官网的下载链接可...

分类：其他好文时间：2014-07-23 17:40:11 阅读次数：273

鸡肋的JdbcRDD

今天准备将mysql的数据倒腾到RDD，很早以前就知道有一个JdbcRDD，就想着使用一下，结果发现却是鸡肋一个。首先，看看JdbcRDD的定义： * An RDD that executes an SQL query on a JDBC connection and reads results. * For usage example, see test case ...

分类：数据库时间：2014-07-23 16:36:21 阅读次数：408

Hive与Hbase区别

hive是什么？白话一点再加不严格一点，hive可以认为是map-reduce的一个包装。hive的意义就是把好写的hive的sql转换为复杂难写的map-reduce程序。于是，hbase是什么？同样白话一点加不严格一点，hbase可以认为是...

分类：其他好文时间：2014-07-23 13:57:36 阅读次数：268

Spark Core源代码分析: Spark任务模型

概述一个Spark的Job分为多个stage，最后一个stage会包含一个或多个ResultTask，前面的stages会包含一个或多个ShuffleMapTasks。ResultTask运行并将结果返回给driver application。ShuffleMapTask将task的output依据...

分类：其他好文时间：2014-07-23 12:43:36 阅读次数：376

“大数据讲师”、“Hadoop讲师”、“Spark讲师”、“云计算讲师”、“Android讲师”

王家林简介Spark亚太研究院院长和首席专家，中国目前唯一的移动互联网和云计算大数据集大成者。在Spark、Hadoop、Android等方面有丰富的源码、实务和性能优化经验。彻底研究了Spark从0.5.0到0.9.1共13个版本的Spark源码，并已完成2014年5月31日发布的Spark1.0...

分类：移动开发时间：2014-07-22 23:29:47 阅读次数：241

夏梦竹谈Hive vs. HBase的区别

对于刚接触大数据的用户来说，要想区分Hive与HBase是有一定难度的。本文将尝试从其各自的定义、特点、限制、应用场景等角度来进行分析，以作抛砖引玉之用。Hive是什么？Apache Hive是一个构建于Hadoop(分布式系统基础架构)顶层的数据仓库，注意这里不是数据库。Hive可以看作是用户编程...

分类：其他好文时间：2014-07-22 22:45:54 阅读次数：257

hive 使用

参考资料1.QuickStarthttps://cwiki.apache.org/confluence/display/Hive/GettingStarted2.Tutorialhttps://cwiki.apache.org/confluence/display/Hive/Tutorial3.官方...

分类：其他好文时间：2014-07-22 22:44:14 阅读次数：249

Spark-Dependency

1、Spark中采用依赖关系(Dependency)表示rdd之间的生成关系。Spark可利用Dependency计算出失效的RDD。在每个RDD中都存在一个依赖关系的列表 private var dependencies_ : Seq[Dependency[_]] = null 用以记录各rdd中各partition的parent partition。 2、Spark中存在两类Depe...

分类：其他好文时间：2014-07-22 22:34:15 阅读次数：264

hive SQL优化之distribute by和sort by

最近在优化hiveSQL，下面是一段排序，分组后取每组第一行记录的SQL INSERT OVERWRITE TABLE t_wa_funnel_distinct_temp PARTITION (pt='${SRCTIME}') SELECT bussiness_id, cookie_id, session_id, funnel_...

分类：数据库时间：2014-07-22 17:42:31 阅读次数：344

Spark SQL Catalyst源码分析之Analyzer

本文详细介绍了Spark SQL的Catalyst里，Analyzer是如何Sql parser的解析的UnResolved逻辑计划，进行resolve的。...

分类：数据库时间：2014-07-22 14:49:52 阅读次数：396

共12366条上一页 1 ... 1206 1207 1208 1209 1210 ... 1237 下一页

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)