码迷,mamicode.com
首页 >  
搜索关键字:rdd spark hive hadoop    ( 23938个结果
Hadoop期末复习(第二章)
第二章.HDFS 1.大数据的两个核心技术 2.HDFS设计目标 3.HDFS自身的局限性 4.HDFS采用块设计以及采用块设计的好处 5.HDFS组成架构 6.元数据信息被持久化到磁盘分为哪两个文件 7.第二名称节点的作用 8.名称节点,数据节点的功能 待补充 9.副本机制、数据容错机制、心跳机制 ...
分类:其他好文   时间:2021-06-28 20:29:20    阅读次数:0
并发编程-ThreadLocal&ForkJoinPool(使用以及原理分析)
并发编程-ThreadLocal&ForkJoinPool(使用以及原理分析) 本章只要聊聊两个东西,这里会给出如何使用他们,并且分析各自的源码以及原理。 【ThreadLocal】:在指定线程中存储数据,数据存储后只有指定线程可以获得 【ForkJoinpool】:实际上他类似于【hadoop】他 ...
分类:其他好文   时间:2021-06-28 18:58:16    阅读次数:0
Hadoop期末考复习第一章-概论
一、大数据的基本特征(4V,存储单位) 二、大数据对思维方式的影响 三、Google 三辆马车是什么? Google的文件系统GFS(Google File System)、分布式计算框架MapReduce、Bigtable 四、Hadoop 是什么,基本特征 基本特征: 五、Hadoop 生态系统 ...
分类:其他好文   时间:2021-06-28 18:27:13    阅读次数:0
Hadoop入门 集群时间同步
集群时间同步 **如果服务器在公网环境(能连接外网),可以不采用集群时间同步。**因为服务器会定期和公网时间进行校准。 如果服务器在内网环境,必须要配置集群时间同步,否则时间久了,会产生时间偏差,导致集群执行任务时间不同步。 时间服务器配置(必须root用户) 首先需要设置一个时间服务器作为基准,其 ...
分类:其他好文   时间:2021-06-28 17:56:59    阅读次数:0
SQOOP 导出Hive数据到MySQL
基本知识:Sqoop导出的基本用法:https://sqoop.apache.org/docs/1.4.6/SqoopUserGuide.html#_syntax_4 的10. sqoop-export 内容摘要:本文主要是对--update-mode参数的用法进行了验证。结论如下: --updat ...
分类:数据库   时间:2021-06-25 17:26:06    阅读次数:0
delta lake minio+dremio 集成试用
参考集成模式 环境准备 基于docker 运行 spark 环境准备 docker run -it -p 8080:8080 datamechanics/spark:jvm-only-3.1-latest sh // 启动master /opt/spark/sbin/start-master.sh ...
分类:其他好文   时间:2021-06-25 16:43:35    阅读次数:0
C# 在代码里切换数据库
strSql = "select DISTINCT GROUPNAME from [172.30.1.133].[Cimes5PRDDB_CN].dbo.AOI_GROUPNAME_SET" ...
分类:数据库   时间:2021-06-24 18:32:25    阅读次数:0
Azkaban 简介(一)
什么是任务调度 大数据平台技术框架支持的开发语言多种多样,开发人员的背景差异也很大,这就产生出很多不同类型的程序(任务)运行在大数据平台之上,如:MapReduce、Hive、Pig、Spark、Java、Shell、Python 等。 这些任务需要不同的运行环境,并且除了定时运行,各种类型之间的任 ...
分类:其他好文   时间:2021-06-23 17:16:53    阅读次数:0
spark内存分配
1.spark内存分配 MemoryManager |__StaticMemoryManager 静态内存管理机制 |__UnifiedMemoryManger 统一内存管理机制 1.静态内存管理机制 静态内存管理机制实现起来较为简单,但没有根据具体的数据规模和计算任务做相应的配置,很容易造成"一半 ...
分类:其他好文   时间:2021-06-23 17:02:31    阅读次数:0
spark-RDD缓存,checkpoint机制,有向无环图,stage
spark-RDD缓存,checkpoint机制,有向无环图,stage 1.RDD依赖关系 RDD依赖关系有2种不同类型,窄依赖和宽依赖。 窄依赖(narrow dependency):是指每个父RDD的Partition最多被子RDD一个Partition使用。就好像独生子女一样。窄依赖的算子包 ...
分类:其他好文   时间:2021-06-22 18:39:47    阅读次数:0
23938条   上一页 1 2 3 4 5 ... 2394 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!