搜索关键字：hive on spark，搜索到12366个结果！码迷,mamicode.com！

hive 多个key需要 group by

请问下,如果有多个统计，要统计的数据都一样，每个统计只是group by 的key不一样，怎样做，才能让这些统计最快完成？恩，比如有10个统计，每个统计都是读取的同一份数据，但是统计的维度不一样，就是groupby的key不一样你们都是怎么处理的？语句类似这个：： from( selectk1,k...

分类：其他好文时间：2014-08-05 15:22:49 阅读次数：352

Apache Spark源码走读之21 -- WEB UI和Metrics初始化及数据更新过程分析

WEB UI和Metrics子系统为外部观察监测Spark内部运行情况提供了必要的窗口，本文将简略的过一下其内部代码实现。

分类：Web程序时间：2014-08-05 11:06:49 阅读次数：311

Spark教程-构建Spark集群-安装Ubuntu系统(1)

Unbuntu系统是我们开发Hadoop时最常用的操作系统，下面带领大家一步步完成Vmware虚拟机下Unbuntu系统的安装创建Vmware中的虚拟系统：我们选择的是“Typical”的方式，点击“Next”进入下一步：选择稍后安装操作系统，点击“Next”进入下一步：选择安装Linux系统的Ub...

分类：其他好文时间：2014-08-05 11:04:59 阅读次数：309

连续时间查询问题-查询一个用户连续登陆天数超过N天的用户

问题：比如查询一个用户连续登陆天数超过7天的用户，或者查询连续在7天的某个时间段登陆的用户。网上查询sql的语句的用法，对于hive来说也可以试试，查询词"SQL 连续天数查询" 如果使用hadoop如何解决？？思路（以连续N天登陆为例）： 1、计算出每天登陆的用户集合 1、使...

分类：其他好文时间：2014-08-05 10:49:29 阅读次数：826

Spark技术内幕：Worker源码与架构解析

Worker所起的作用有以下几个： 1. 接受Master的指令，启动或者杀掉Executor 2. 接受Master的指令，启动或者杀掉Driver 3. 报告Executor/Driver的状态到Master 4. 心跳到Master，心跳超时则Master认为Worker已经挂了不能工作了 5. 向GUI报告Worker的状态...

分类：其他好文时间：2014-08-05 00:50:08 阅读次数：364

Spark SQL CLI 实现分析

本文主要介绍了Spark SQL里目前的CLI实现，代码之后肯定会有不少变动，所以我关注的是比较核心的逻辑。主要是对比了Hive CLI的实现方式，比较Spark SQL在哪块地方做了修改，哪些地方与Hive CLI是保持一致的。基本上Spark SQL在CLI这块的实现很靠近Hive Service项目里的CLI模块，主要类继承体系、执行逻辑差不多都一样。Spark SQL修改的关键逻辑在CLIService内的SessionManager内的OperationManager里，将非元数据查询操作的q...

分类：数据库时间：2014-08-05 00:44:58 阅读次数：939

TextFile SequencFile性能对比

首先所有的输入格式都继承FileInputFormat，对于TextFile和SequenceFile有对应的TextInputFormat和SequenceFileInputFormat。我们先来看一下TextInputFormat的实现：publicclassTextInputFormatextendsFileInputFormat<LongWritable,Text> implementsJobConfigurable{ p..

分类：其他好文时间：2014-08-04 18:17:29 阅读次数：677

【互动问答分享】第6期决胜云计算大数据时代Spark亚太研究院公益大讲堂

分类：其他好文时间：2014-08-04 17:08:57 阅读次数：211

Spark on Yarn遇到的几个问题

1 概述 Spark的on Yarn模式，其资源分配是交给Yarn的ResourceManager来进行管理的，但是目前的Spark版本，Application日志的查看，只能通过Yarn的yarn logs命令实现。在部署和运行Spark Application的过程中，如果不注意一些小的细节，也许会导致一些问题的出现。 2 防火墙部署好Spark...

分类：其他好文时间：2014-08-04 14:23:27 阅读次数：297

scala eclipse sbt 应用程序开发

在Eclipse里利用Sbt构建开发Scala程序的一般步骤，并用实例讲解了整个流程。...

分类：系统相关时间：2014-08-04 02:03:06 阅读次数：476

共12366条上一页 1 ... 1200 1201 1202 1203 1204 ... 1237 下一页

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)