hive作为一个sql查询引擎,自带了一些基本的函数,比如count(计数),sum(求和),有时候这些基本函数满足不了我们的需求,这时候就要写hive hdf(user defined funation),又叫用户自定义函数。 UDF 创建与使用步骤 继承org.apache.hadoop.hiv ...
分类:
其他好文 时间:
2020-12-25 13:07:42
阅读次数:
0
一. 前期准备 1. Vmware workstation pro 16 官网下载 : https://www.vmware.com/ 密钥:ZF3R0-FHED2-M80TY-8QYGC-NPKYF (若失效请自行百度) 2. xshell,xftp 官网下载(需要注册) 3. 国内镜像网站下载c ...
建议在用Scala编写相关功能实现时,边学习、边应用、边摸索以加深对Scala的理解和应用 ...
分类:
其他好文 时间:
2020-12-21 11:32:22
阅读次数:
0
章节: 第一章节:CentOS 7 配置hadoop(一) 安装虚拟机(伪分布) 第二章节:CentOS 7 配置hadoop(二) 配置hdfs(伪分布) 第三章节:CentOS 7 配置hadoop(三) 配置hbase(伪分布) 第四章节:CentOS 7 配置hadoop(四) 配置hive ...
分类:
其他好文 时间:
2020-12-21 11:30:46
阅读次数:
0
hadoop Shuffle Error: Exceeded MAX_FAILED_UNIQUE_FETCHES; bailing-out 程序里面需要打开多个文件,进行分析,系统一般默认数量是1024,(用ulimit -a可以看到)对于正常使用是够了,但是对于程序来讲,就太少了。修改办法:修改2 ...
分类:
其他好文 时间:
2020-12-19 13:37:26
阅读次数:
3
Scala是以JVM为运行环境的面向对象的函数式编程语言,它可以直接访问Java类库并且与Java框架进行交互操作 ...
分类:
其他好文 时间:
2020-12-19 13:14:39
阅读次数:
1
连接hdfs 根据hdfs的版本引用相关的hdfs依赖 <!-- https://mvnrepository.com/artifact/org.apache.hadoop/hadoop-client --> <dependency> <groupId>org.apache.hadoop</group ...
本节课主要介绍如何在 Serverless Kubernetes 集群中低成本运行 Spark 数据计算。首先简单介绍下阿里云 Serverless Kubernetes 和 弹性容器实例 ECI 这两款产品;然后介绍 Spark on Kubernetes;最后进行实际演示。
分类:
其他好文 时间:
2020-12-17 12:22:18
阅读次数:
2
1. 配置主机名 [root@hadoop01 ~]# hostname #显示当前主机名 方法一:通过配置文件/etc/hostname (重启后生效) [root@hadoop01 ~]# vim /etc/hostname 方法二:通过命令hostnamectl set-hostname 新主 ...
分类:
其他好文 时间:
2020-12-17 12:11:05
阅读次数:
2
1、基本架构 (1)、应用程序Spark 应用程序由一个驱动器进程和一组执行器进程组成。驱动进程运行 main()函数,位于集群中的一个节点上,它负责三件事:维护 Spark 应用程序的相关信息;回应用户的程序或输入;分析任务并分发给若干执行器进行处理。驱动器是必须的,它是 Spark 应用程序的核 ...
分类:
其他好文 时间:
2020-12-17 12:09:25
阅读次数:
2