有序集合有两种编码方式:压缩列表 ziplist 和跳表 skiplist。 ...
分类:
其他好文 时间:
2021-01-16 12:09:10
阅读次数:
0
热身30题 1.描述一下HDFS的写流程 2.描述一下HDFS的读流程 3.详细讲解一下HDFS的体系结构 4.如果一个datanode出现宕机,恢复流程是什么样的? 5.通常你是如何解决Haddop的NameNode宕机的,流程是什么? 6.描述一下NameNode对元数据的管理 7.NameNo ...
分类:
其他好文 时间:
2021-01-14 10:47:06
阅读次数:
0
原文链接:https://blog.csdn.net/qq_26803795/article/details/106522611 文章目录 一、前言 二、内置分词器解析 2.1、内置分词器梳理 2.2、内置分词器对中文的局限性 三、安装IK分词器 3.1、下载IK分词器 3.2、编译源码包 3.3、 ...
分类:
其他好文 时间:
2021-01-12 10:47:41
阅读次数:
0
public static IFeatureClass FeatureToFeature(IFeatureClass SourFeature,IFeatureClass TargetFeature, List<ColumnInternationMapping> columnMapp,bool IsO ...
分类:
其他好文 时间:
2021-01-11 11:06:09
阅读次数:
0
什么是druid druid是一个为OLAP查询需求而设计的开源大数据系统,druid提供低延时的数据插入,实时的数据查询 druid使用Java开发,基于Jetty提供http rest服务,也提供了Java/Python等语言的工具包 druid是一个集群系统,使用zookeeper做节点管理和 ...
分类:
其他好文 时间:
2021-01-08 10:28:10
阅读次数:
0
Atlas 作用: 记录并展示Hive表字段含义,以及表和字段之间的数据血缘关系。 局限: 依赖HBase和solr。 Azkaban 作用: 实现任务流执行,满足任务间依赖关系。 局限: 任务能添加依赖的任务,但是不能传参数,任务流中任意一条路线断了,不能这条路线重启执行。 ...
分类:
其他好文 时间:
2021-01-07 12:23:38
阅读次数:
0
1.为什么安装Impala一定要先安装Hive? Impala是基于Hive的大数据实时分析查询引擎,直接使用Hive的元数据库Metadata,意味着impala元数据都存储在Hive的metastore中。 2.Impala与Hive的关系? Impala 与Hive都是构建在Hadoop之上的 ...
分类:
其他好文 时间:
2021-01-06 11:58:32
阅读次数:
0
在代码中我们可以只加上标签@Data 而不用get,set方法; val : 和 scala 中 val 同名, 可以在运行时确定类型; @NonNull : 注解在参数上, 如果该类参数为 null , 就会报出异常, throw new NullPointException(参数名) @Clea ...
分类:
其他好文 时间:
2021-01-04 11:15:37
阅读次数:
0
所学时间(包括上课) 9个小时 代码量(行) 1300 博客量 1篇 了解到的知识点 centos虚拟机的安装以及 大数据相应所用的软件安装 以及环境的配置 ...
分类:
其他好文 时间:
2021-01-02 11:40:57
阅读次数:
0
scala> val df = sc.parallelize(Seq( | (0,"cat26",30.9), | (1,"cat67",28.5), | (2,"cat56",39.6), | (3,"cat8",35.6))).toDF("Hour", "Category", "Value") ...
分类:
其他好文 时间:
2021-01-02 11:32:57
阅读次数:
0