码迷,mamicode.com
首页 >  
搜索关键字:spark hadoop    ( 19685个结果
Hive中的UDF详解
hive作为一个sql查询引擎,自带了一些基本的函数,比如count(计数),sum(求和),有时候这些基本函数满足不了我们的需求,这时候就要写hive hdf(user defined funation),又叫用户自定义函数。 UDF 创建与使用步骤 继承org.apache.hadoop.hiv ...
分类:其他好文   时间:2020-12-25 13:07:42    阅读次数:0
win10+centos7+hadoop 集群环境搭建
一. 前期准备 1. Vmware workstation pro 16 官网下载 : https://www.vmware.com/ 密钥:ZF3R0-FHED2-M80TY-8QYGC-NPKYF (若失效请自行百度) 2. xshell,xftp 官网下载(需要注册) 3. 国内镜像网站下载c ...
分类:Windows程序   时间:2020-12-25 12:00:06    阅读次数:0
学好Spark/Kafka必须要掌握的Scala技术点(三)高阶函数、方法、柯里化、隐式转换
建议在用Scala编写相关功能实现时,边学习、边应用、边摸索以加深对Scala的理解和应用 ...
分类:其他好文   时间:2020-12-21 11:32:22    阅读次数:0
CentOS 7 配置hadoop(五) 配置sqoop(伪分布)
章节: 第一章节:CentOS 7 配置hadoop(一) 安装虚拟机(伪分布) 第二章节:CentOS 7 配置hadoop(二) 配置hdfs(伪分布) 第三章节:CentOS 7 配置hadoop(三) 配置hbase(伪分布) 第四章节:CentOS 7 配置hadoop(四) 配置hive ...
分类:其他好文   时间:2020-12-21 11:30:46    阅读次数:0
hadoop Shuffle Error: Exceeded MAX_FAILED_UNIQUE_FETCHES; bailing-out
hadoop Shuffle Error: Exceeded MAX_FAILED_UNIQUE_FETCHES; bailing-out 程序里面需要打开多个文件,进行分析,系统一般默认数量是1024,(用ulimit -a可以看到)对于正常使用是够了,但是对于程序来讲,就太少了。修改办法:修改2 ...
分类:其他好文   时间:2020-12-19 13:37:26    阅读次数:3
学好Spark/Kafka必须要掌握的Scala技术点(二)类、单例/伴生对象、继承和trait,模式匹配、样例类(case class)
Scala是以JVM为运行环境的面向对象的函数式编程语言,它可以直接访问Java类库并且与Java框架进行交互操作 ...
分类:其他好文   时间:2020-12-19 13:14:39    阅读次数:1
hdfs的相关api
连接hdfs 根据hdfs的版本引用相关的hdfs依赖 <!-- https://mvnrepository.com/artifact/org.apache.hadoop/hadoop-client --> <dependency> <groupId>org.apache.hadoop</group ...
分类:Windows程序   时间:2020-12-18 13:06:56    阅读次数:4
如何在 Serverless K8s 集群中低成本运行 Spark 数据计算?
本节课主要介绍如何在 Serverless Kubernetes 集群中低成本运行 Spark 数据计算。首先简单介绍下阿里云 Serverless Kubernetes 和 弹性容器实例 ECI 这两款产品;然后介绍 Spark on Kubernetes;最后进行实际演示。
分类:其他好文   时间:2020-12-17 12:22:18    阅读次数:2
从零搭建hadoop集群之系统管理操作
1. 配置主机名 [root@hadoop01 ~]# hostname #显示当前主机名 方法一:通过配置文件/etc/hostname (重启后生效) [root@hadoop01 ~]# vim /etc/hostname 方法二:通过命令hostnamectl set-hostname 新主 ...
分类:其他好文   时间:2020-12-17 12:11:05    阅读次数:2
spark浅析
1、基本架构 (1)、应用程序Spark 应用程序由一个驱动器进程和一组执行器进程组成。驱动进程运行 main()函数,位于集群中的一个节点上,它负责三件事:维护 Spark 应用程序的相关信息;回应用户的程序或输入;分析任务并分发给若干执行器进行处理。驱动器是必须的,它是 Spark 应用程序的核 ...
分类:其他好文   时间:2020-12-17 12:09:25    阅读次数:2
19685条   上一页 1 ... 23 24 25 26 27 ... 1969 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!