码迷,mamicode.com
首页 >  
搜索关键字:ambari hadoop hbase hive spark    ( 26003个结果
Kettle读取mysql数据存入Hive分区表中,使用Impala查询
操作步骤 1)TmpBstAggZwTktModelD 按天读取Mysql表数据bst_agg_zw_tkt_model_d,存入hive临时表tmp_bst_agg_zw_tkt_model_d(临时表采用txt格式,按年月日进行分区) 2)HiveBstAggZwTktModelD 连接hive ...
分类:数据库   时间:2020-07-20 13:08:14    阅读次数:129
运行spark时提示 env: ‘python’: No such file or directory
运行spark时提示如下信息: hadoop@MS-YFYCEFQFDMXS:/home/trp$ cd /usr/local/spark hadoop@MS-YFYCEFQFDMXS:/usr/local/spark$ ./bin/pyspark env: ‘python’: No such fi ...
分类:编程语言   时间:2020-07-19 23:47:58    阅读次数:111
Hadoop基础(二十一):Shuffle机制(二)
4 WritableComparable排序 1.排序的分类 2.自定义排序WritableComparable (1)原理分析 bean对象做为key传输,需要实现WritableComparable接口重写compareTo方法,就可以实现排序。 @Override public int com ...
分类:其他好文   时间:2020-07-19 23:23:07    阅读次数:67
Hadoop基础(二十二):Shuffle机制(三)
7 Combiner合并 (6)自定义Combiner实现步骤 (a)自定义一个Combiner继承Reducer,重写Reduce方法 public class WordcountCombiner extends Reducer<Text, IntWritable, Text,IntWritabl ...
分类:其他好文   时间:2020-07-19 23:19:55    阅读次数:69
Hadoop基础(二十三):MapTask工作机制
MapTask工作机制 MapTask工作机制如图4-12所示。 图4-12 MapTask工作机制 (1)Read阶段:MapTask通过用户编写的RecordReader,从输入InputSplit中解析出一个个key/value。 (2)Map阶段:该节点主要是将解析出的key/value交给 ...
分类:其他好文   时间:2020-07-19 23:10:43    阅读次数:67
Hadoop基础(二十四):ReduceTask工作机制
1.ReduceTask工作机制 ReduceTask工作机制,如图4-19所示。 图4-19 ReduceTask工作机制 (1)Copy阶段:ReduceTask从各个MapTask上远程拷贝一片数据,并针对某一片数据,如果其大小超过一定阈值,则写到磁盘上,否则直接放到内存中。 (2)Merge ...
分类:其他好文   时间:2020-07-19 23:09:27    阅读次数:72
hdfs、hive、hbase的搭建总结
jdk的安装 上传jdk的安装包到linux中 解压、更名 [root@qianfeng01 software]# tar -zxvf jdk-8u221-linux-x64.tar.gz -C /usr/local/ [root@qianfeng01 software]# cd /usr/loca ...
分类:其他好文   时间:2020-07-19 17:54:49    阅读次数:72
Hadoop+HBase 集群搭建
1. 环境准备 说明:本次集群搭建使用系统版本Centos 7.5 ,软件版本 V3.1.1。 1.1 配置说明 本次集群搭建共三台机器,具体说明下: 主机名 IP 说明 hadoop01 10.0.0.10 DataNode、NodeManager、NameNode hadoop02 10.0.0 ...
分类:其他好文   时间:2020-07-19 16:31:06    阅读次数:63
MapReduce之自定义InputFormat
在企业开发中,Hadoop框架自带的InputFormat类型不能满足所有应用场景,需要自定义InputFormat来解决实际问题。 自定义InputFormat步骤如下: (1)自定义一个类继承FilelnputFormat。 (2)自定义一个类继承RecordReader,实现一次读取一个完整文 ...
分类:其他好文   时间:2020-07-19 16:25:43    阅读次数:67
spark 广播变量 累加器
广播变量object Main { def main(args: Array[String]): Unit = { val sparkConf = new SparkConf().setAppName("readMysql").setMaster("local[2]") val sparkConte ...
分类:其他好文   时间:2020-07-19 11:44:16    阅读次数:62
26003条   上一页 1 ... 58 59 60 61 62 ... 2601 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!