码迷,mamicode.com
首页 >  
搜索关键字:ambari hadoop hbase hive spark    ( 26003个结果
Arctern Spark单机可视化入门
Arctern基于开源大数据生态,构建灵活、强大、高性能的时空数据分析平台,帮助用户应对5G/IoT带来的新型数据挑战,加速时空数据的处理、分析、模型预测与呈现。本文中将会介绍Arctern Spark单机可视化安装和简单使用 安装和验证 参考单机安装arctern和在线安装单机spark 一:要注 ...
分类:其他好文   时间:2020-06-26 22:01:05    阅读次数:47
入门大数据---Spark_Streaming与流处理
一、流处理 1.1 静态数据处理 在流处理之前,数据通常存储在数据库,文件系统或其他形式的存储系统中。应用程序根据需要查询数据或计算数据。这就是传统的静态数据处理架构。Hadoop 采用 HDFS 进行数据存储,采用 MapReduce 进行数据查询或分析,这就是典型的静态数据处理架构。 1.2 流 ...
分类:其他好文   时间:2020-06-26 20:02:43    阅读次数:49
JDBC_Hive & coding
hive2启动-hive --service hiveserver2 &-service mysqld start- beeline -u jdbc:hive2://localhost:10000配置依赖-hive-jdbc 对应hive版本: 2.1.1-hive-common 对应hive版本:... ...
分类:数据库   时间:2020-06-26 19:57:06    阅读次数:53
Hive1.2.2(五)优化
1、hive的企业级调优 1.1 Fetch抓取(鸡肋) Fetch抓取是指,==Hive中对某些情况的查询可以不必使用MapReduce计算== 例如:select * from employee; 在这种情况下,Hive可以简单地读取employee对应的存储目录下的文件,然后输出查询结果到控制 ...
分类:其他好文   时间:2020-06-26 18:44:35    阅读次数:56
Hive1.2.2(四)
1. order by,sort by,distribute by,cluster by的区别? 2. 聚合函数是否可以写在order by后面,为什么? 需求催生技术进步 一、课前准备 二、课堂主题 三、课堂目标 1. 掌握hive表的数据压缩和文件存储格式 2. 掌握hive的JDBC代码操作 ...
分类:其他好文   时间:2020-06-26 18:42:15    阅读次数:58
入门大数据---SparkSQL外部数据源
一、简介 1.1 多数据源支持 Spark 支持以下六个核心数据源,同时 Spark 社区还提供了多达上百种数据源的读取方式,能够满足绝大部分使用场景。 CSV JSON Parquet ORC JDBC/ODBC connections Plain-text files 注:以下所有测试文件均可从 ...
分类:数据库   时间:2020-06-26 18:39:56    阅读次数:61
入门大数据---SparkSQL联结操作
一、 数据准备 本文主要介绍 Spark SQL 的多表连接,需要预先准备测试数据。分别创建员工和部门的 Datafame,并注册为临时视图,代码如下: val spark = SparkSession.builder().appName("aggregations").master("local[ ...
分类:数据库   时间:2020-06-26 18:28:15    阅读次数:72
入门大数据---SparkSQL常用聚合函数
一、简单聚合 1.1 数据准备 // 需要导入 spark sql 内置的函数包 import org.apache.spark.sql.functions._ val spark = SparkSession.builder().appName("aggregations").master("lo ...
分类:数据库   时间:2020-06-26 18:03:35    阅读次数:58
Hadoop--Hive
DDL数据定义 4.1 创建数据库 CREATE DATABASE [IF NOT EXISTS] database_name [COMMENT database_comment] [LOCATION hdfs_path] [WITH DBPROPERTIES (property_name=prop ...
分类:其他好文   时间:2020-06-26 16:46:06    阅读次数:72
(一)Sqoop搭建
一.集群规划 Name Master Slave1 Slave2 IP 192.168.2.98 192.168.2.99 192.168.2.100 Jdk版本 1.8.0.171 1.8.0.171 1.8.0.171 Zookeeper版本 3.4.10 3.4.10 3.4.10 Hadoo ...
分类:其他好文   时间:2020-06-26 16:25:56    阅读次数:66
26003条   上一页 1 ... 74 75 76 77 78 ... 2601 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!