搜索关键字：ambari hadoop hbase hive spark，搜索到26003个结果！码迷,mamicode.com！

Kettle读取mysql数据存入Hive分区表中,使用Impala查询

操作步骤 1）TmpBstAggZwTktModelD 按天读取Mysql表数据bst_agg_zw_tkt_model_d，存入hive临时表tmp_bst_agg_zw_tkt_model_d（临时表采用txt格式，按年月日进行分区） 2）HiveBstAggZwTktModelD 连接hive ...

分类：数据库时间：2020-07-20 13:08:14 阅读次数：129

运行spark时提示 env: ‘python’: No such file or directory

运行spark时提示如下信息： hadoop@MS-YFYCEFQFDMXS:/home/trp$ cd /usr/local/spark hadoop@MS-YFYCEFQFDMXS:/usr/local/spark$ ./bin/pyspark env: ‘python’: No such fi ...

分类：编程语言时间：2020-07-19 23:47:58 阅读次数：111

Hadoop基础（二十一）：Shuffle机制（二）

4 WritableComparable排序 1．排序的分类 2．自定义排序WritableComparable （1）原理分析 bean对象做为key传输，需要实现WritableComparable接口重写compareTo方法，就可以实现排序。 @Override public int com ...

分类：其他好文时间：2020-07-19 23:23:07 阅读次数：67

Hadoop基础（二十二）：Shuffle机制（三）

7 Combiner合并（6）自定义Combiner实现步骤（a）自定义一个Combiner继承Reducer，重写Reduce方法 public class WordcountCombiner extends Reducer<Text, IntWritable, Text,IntWritabl ...

分类：其他好文时间：2020-07-19 23:19:55 阅读次数：69

Hadoop基础（二十三）：MapTask工作机制

MapTask工作机制 MapTask工作机制如图4-12所示。图4-12 MapTask工作机制（1）Read阶段：MapTask通过用户编写的RecordReader，从输入InputSplit中解析出一个个key/value。（2）Map阶段：该节点主要是将解析出的key/value交给 ...

分类：其他好文时间：2020-07-19 23:10:43 阅读次数：67

Hadoop基础（二十四）：ReduceTask工作机制

1．ReduceTask工作机制 ReduceTask工作机制，如图4-19所示。图4-19 ReduceTask工作机制（1）Copy阶段：ReduceTask从各个MapTask上远程拷贝一片数据，并针对某一片数据，如果其大小超过一定阈值，则写到磁盘上，否则直接放到内存中。（2）Merge ...

分类：其他好文时间：2020-07-19 23:09:27 阅读次数：72

hdfs、hive、hbase的搭建总结

jdk的安装上传jdk的安装包到linux中解压、更名 [root@qianfeng01 software]# tar -zxvf jdk-8u221-linux-x64.tar.gz -C /usr/local/ [root@qianfeng01 software]# cd /usr/loca ...

分类：其他好文时间：2020-07-19 17:54:49 阅读次数：72

Hadoop+HBase 集群搭建

1. 环境准备说明：本次集群搭建使用系统版本Centos 7.5 ，软件版本 V3.1.1。 1.1 配置说明本次集群搭建共三台机器，具体说明下: 主机名 IP 说明 hadoop01 10.0.0.10 DataNode、NodeManager、NameNode hadoop02 10.0.0 ...

分类：其他好文时间：2020-07-19 16:31:06 阅读次数：63

MapReduce之自定义InputFormat

在企业开发中，Hadoop框架自带的InputFormat类型不能满足所有应用场景，需要自定义InputFormat来解决实际问题。自定义InputFormat步骤如下：（1）自定义一个类继承FilelnputFormat。（2）自定义一个类继承RecordReader，实现一次读取一个完整文 ...

分类：其他好文时间：2020-07-19 16:25:43 阅读次数：67

spark 广播变量累加器

广播变量object Main { def main(args: Array[String]): Unit = { val sparkConf = new SparkConf().setAppName("readMysql").setMaster("local[2]") val sparkConte ...

分类：其他好文时间：2020-07-19 11:44:16 阅读次数：62

共26003条上一页 1 ... 58 59 60 61 62 ... 2601 下一页

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)