码迷,mamicode.com
首页 >  
搜索关键字:spark 大数据 hadoop spark-sql    ( 29965个结果
hadoop基础概念之Hadoop核心组件
认知和学习Hadoop,我们必须得了解Hadoop的构成,我根据自己的经验通过Hadoop构件、大数据处理流程,Hadoop核心三个方面进行一下介绍: 一、 Hadoop组件 由图我们可以看到Hadoop组件由底层的Hadoop核心构件以及上层的Hadoop生态系统共同集成,而上层的生态系统都是基于 ...
分类:其他好文   时间:2020-10-29 10:11:31    阅读次数:19
大数据面试题之葵花宝典------flume
葵花宝典 flume 1. Flume组成,Put事务,Take事务 2. Flume拦截器 3. Flume Channel选择器 4. Flume监控器 5. Flume采集数据会丢失吗?(防止数据丢失的机制) 6. Flume内存 7. FileChannel优化 1. Flume组成,Put ...
分类:Web程序   时间:2020-10-29 10:09:33    阅读次数:36
Hadoop框架:HDFS高可用环境配置
在单点或者少数节点故障的情况下,集群还可以正常的提供服务,HDFS高可用机制可以通过配置Active/Standby两个NameNodes节点实现在集群中对NameNode的热备来消除单节点故障问题,如果单个节点出现故障,可通过该方式将NameNode快速切换到另外一个节点上。
分类:其他好文   时间:2020-10-29 09:35:04    阅读次数:15
为什么越来越多的企业选择商业智能BI?
?在大数据,云计算,工业4.0,物联网等概念概念炒得飞起的年代,现在已经变成某宝天天给我推送我感兴趣的东西。由此可见数据和科技正在慢慢深刻地改变我们的生活。随着时代的发展,各个企业的内部决策方式也是发生着巨大的变化,而缩短企业内部的决策时间和提高决策的效率是各个企业追求的目标。1、可视化报表呈现运用商业智能BI中的可视化图表可以将企业日常的业务数据(财务、供应链、人力、运营、市场、销售、产品等)全
分类:其他好文   时间:2020-10-29 09:27:41    阅读次数:22
源码编译搭建Spark3.x环境
Spark源码编译官方文档:https://spark.apache.org/docs/latest/building-spark.html用于编译源码的机器最好满足如下配置:CPU>=4核内存>=8G首先安装好JDK、Scala和Maven,由于安装都比较简单,本文就不演示了,我这里使用的JDK、Scala和Maven版本如下:[root@spark01~]#java-version
分类:其他好文   时间:2020-10-27 11:54:44    阅读次数:43
启动YARN并运行MapReduce程序(伪分布式模式)
配置集群 配置yarn-env.sh Linux系统中获取JDK的安装路径 [xiaoran@hadoop101 hadoop-2.7.2]$ echo $JAVA_HOME /opt/module/jdk1.8.0_144 修改JAVA_HOME路径 [xiaoran@hadoop101 hado ...
分类:其他好文   时间:2020-10-27 11:36:17    阅读次数:28
吴忠办吴忠证UUX
办吴忠证〖溦: bzs8777〗哪里办吴忠证件〖電/溦:182.1648.9071同号〗本地办理各类.证.件《诚.信.第一/专.业.定.制》自从数据源读取数据,到最终写出数据到表,无处不是使用Spark RDD作为主要数据结构,甚至连普通的工具类,都使用Spark API实现,可以说Hudi就是用S ...
分类:其他好文   时间:2020-10-27 11:31:30    阅读次数:27
spark sql 判断一列是否包含某字符
spark sql 的function中有一个 instr 可以判断其中一列是否是另外一列的子字符 新增字段 判断一个字段是否包含另一个字段的字符串,如果包含值为1否则是0 Df.withColumn("newColumn",when(instr(col("aColumn"),col("bColum ...
分类:数据库   时间:2020-10-27 10:54:18    阅读次数:55
JDBC 规范中文版 4.2 -第三章 新特性
3.1 新特性概览 JDBC 4.2 API在以下方面引入了新的内容和变更: 添加对REF CURSOR支持REF CURSOR 该特性主要用于多个数据库支持REF CURSOR数据类型以返回 存储过程的结果 支持返回大数据量的更新返回值 用于支持在更新后返回条数一般为int类型,这会导致如更新的数 ...
分类:数据库   时间:2020-10-26 11:20:55    阅读次数:30
Hadoop基础之环境搭建
Hadoop基础之环境搭建 环境搭建 本地环境 可以用于开发的单节点模式,没有分布式的概念 伪分布式环境 一个节点表示一整个集群,但是分布式的概念,一个节点充当分布式里的所有角色 完全分布式 一个集群中有N个节点,他们分别充当分布式中不同的角色,完成不同的任务 伪分布式环境搭建 下载安装包 Hado ...
分类:其他好文   时间:2020-10-26 11:17:07    阅读次数:16
29965条   上一页 1 ... 45 46 47 48 49 ... 2997 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!