搜索关键字：spark on hive，搜索到12366个结果！码迷,mamicode.com！

大数据平台建设 —— SQL查询引擎之Presto

大数据查询引擎Presto简介SQLonHadoop：Hive的出现让技术人员可以通过类SQL的方式对批量数据进行查询，而不用开发MapReduce程序MapReduce计算过程中大量的中间结果磁盘落地使运行效率较低为了提高SQLonHadoop的效率，各大工具应运而生，比如Shark、Impala等SQLonHadoop的常见工具：Presto是什么：Presto是由Facebook开发的分布式

分类：数据库时间：2020-11-21 12:01:11 阅读次数：8

深入探讨HBASE

HBase是一个高可靠、高性能、面向列的，主要用于海量结构化和半结构化数据存储的分布式key-value存储系统。它基于Google Bigtable开源实现，但二者有明显的区别：Google Bigtable基于GFS存储，通过MAPREDUCE处理存储的数据，通过chubby处理协同服务；而HB... ...

分类：其他好文时间：2020-11-20 12:05:39 阅读次数：11

IDEA连接hive

使用工具连接hive: https://blog.csdn.net/weixin_44508906/article/details/91348665代码连接：先从虚拟机上找到把这三个jar包加到file->Project Structure->Modules->Dependencies 点击ok ...

分类：其他好文时间：2020-11-20 11:51:40 阅读次数：5

【问题】Spark Streaming批次处理耗时问题排查

Spark Streaming处理流程中，遇到某些批次耗时长的问题，排查思路

分类：其他好文时间：2020-11-18 13:12:54 阅读次数：8

大数据平台之权限管理组件 - Aapche Ranger

ApacheRanger简介ApacheRanger提供一个集中式安全管理框架,并解决授权和审计。它可以对Hadoop生态的组件如HDFS、Yarn、Hive、Hbase等进行细粒度的数据访问控制。通过操作Ranger控制台，管理员可以轻松的通过配置策略来控制用户访问权限。Ranger优点：丰富的组件支持（HDFS，HBASE，HIVE，YARN，KAFKA，STORM）提供了细粒度级权限控制（h

分类：其他好文时间：2020-11-18 13:10:32 阅读次数：10

Hive数据仓库之权限管理

Hadoop/Hive自带权限控制集群安全下需求：支持多组件，最好能支持当前大数据技术栈的主要组件，HDFS、HBASE、HIVE、YARN、KAFKA等支持细粒度的权限控制，可以达到HIVE列，HDFS目录，HBASE列,YARN队列开源，社区活跃，按照现有的集群情况改动尽可能的小，而且要符合业界的趋势。现有方案：Hadoop、Hive本身的权限控制Kerberos安全认证ApacheRange

分类：其他好文时间：2020-11-18 12:15:31 阅读次数：8

Hive Join优化

Hive Join优化以及Hive Join的几个重要特点，在实际使用时也可以利用下列特点做相应优化 ...

分类：其他好文时间：2020-11-17 12:55:26 阅读次数：18

Spark Stuctured Streaming 读取文件夹数据

package com.atguigu.structure.streaming import org.apache.spark.sql.streaming.Trigger import org.apache.spark.sql.{DataFrame, SparkSession} import org ...

分类：其他好文时间：2020-11-16 13:25:07 阅读次数：3

12个行业月均阅读超100亿，看Spark如何助力微博Feed算法提升活跃度

12个行业月均阅读超100亿，看Spark如何助力微博Feed算法提升活跃度#编者按：本文由高可用架构向黄波约稿，介绍黄波在SparkSummitChina2016中的演讲精华，并侧重对微博系统和Feed系统进行了更多的介绍。黄波，2010年加入新浪微博，微博研发中心Feed技术专家，负责微博Feed流排序和推荐相关项目。目前专注于基于Spark、Storm等计算平台的大数据处理，致力于将分布式计

分类：编程语言时间：2020-11-16 13:06:48 阅读次数：9

华为 FusionInsight HD Hive数据库

1.环境的安装与准备参考下图： 2.数据库服务的安装与添加（HADOOP，HDFS，HIVE）如下图所示： 3.华为官网的文档的指导手册（HADOOP，HDFS，HIVE） FusionInsight HD 6.5.1 应用开发指南 03 https://support.huawei.com/e ...

分类：数据库时间：2020-11-13 12:11:51 阅读次数：18

共12366条上一页 1 ... 24 25 26 27 28 ... 1237 下一页

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)